| | 72 | |
| | 73 | |
| | 74 | == Modelo Probit == |
| | 75 | |
| | 76 | La función de enlace del modelo probit es la inversa de la función de distribución normal (con parámetros: media 0 y varianza 1): |
| | 77 | {{{ |
| | 78 | Probit(p) = InvDistNormal(p) |
| | 79 | }}} |
| | 80 | cuya inversa es: |
| | 81 | {{{ |
| | 82 | InvProbit(z) = DistNormal(z) |
| | 83 | }}} |
| | 84 | |
| | 85 | Así, la primera derivada de la inversa de la función de enlace, no es otra que la función de densidad normal: |
| | 86 | {{{ |
| | 87 | d(InvProbit(z))/dz = DensNormal(z) = 1/Sqrt(2Pi) * Exp(-z^2/2) |
| | 88 | }}} |
| | 89 | |
| | 90 | === Verosimilitud y derivadas === |
| | 91 | |
| | 92 | ==== Log-Likelihood ==== |
| | 93 | |
| | 94 | El logaritmo de la verosimilitud (''log-likelihood'') es: |
| | 95 | {{{ |
| | 96 | LogL = Sum_i( Y_i*Log(P_i) + (1-Y_i)*Log(1-P_i) ) |
| | 97 | }}} |
| | 98 | donde el subíndice {{{i}}} hace referencia a la {{{i}}}-ésima observación. |
| | 99 | |
| | 100 | Teniendo en cuenta que la probabilidad de la {{{i}}}-ésima observación viene dada por: |
| | 101 | {{{ |
| | 102 | P_i = DistNormal(B'X_i) |
| | 103 | }}} |
| | 104 | podemos escribir: |
| | 105 | {{{ |
| | 106 | LogL = Sum_i( Y_i*Log(DistNormal(B'X_i)) + (1-Y_i)*Log(1-DistNormal(B'X_i)) ) = |
| | 107 | |
| | 108 | = Sum_i( Y_i*Log(DistNormal(B'X_i)) + (1-Y_i)*Log(DistNormal(-B'X_i)) ) |
| | 109 | }}} |
| | 110 | |
| | 111 | ==== Gradient ==== |
| | 112 | |
| | 113 | La primera derivada respecto a la matriz de parámetros ({{{B}}}) es el gradiente del logaritmo de la verosimilitud: |
| | 114 | |
| | 115 | {{{ |
| | 116 | G(B) = d(LogL(B))/dB = |
| | 117 | |
| | 118 | = Sum_i( ( Y_i*DensNormal(B'X_i)/DistNormal(B'X_i) - (1-Y_i)*DensNormal(-B'X_i)/DistNormal(-B'X_i) ) * X_i ) |
| | 119 | |
| | 120 | = Sum_i( ( Y_i*Q(B'X_i) - (1-Y_i)*Q(-B'X_i) ) * X_i ) |
| | 121 | }}} |
| | 122 | |
| | 123 | donde el cociente entre las funciones de densidad y distribución se ha definido como: |
| | 124 | {{{ |
| | 125 | Q(x) = DensNormal(x)/DistNormal(x) |
| | 126 | }}} |
| | 127 | |
| | 128 | ==== Hessian ==== |
| | 129 | |
| | 130 | La segunda derivada respecto a la matriz de parámetros ({{{B}}}) es la hessiana del logaritmo de la verosimilitud: |
| | 131 | |
| | 132 | {{{ |
| | 133 | H(B) = d^2(LogL(B))/(dB dB') = |
| | 134 | |
| | 135 | = Sum_i( ( Y_i*Q(B'X_i)*(Q(B'X_i)+B'X_i) + (1-Y_i)*Q(-B'X_i)*(Q(-B'X_i)-B'X_i) ) * X_i * X'_i ) |
| | 136 | }}} |
| | 137 | |
| | 138 | donde se usado que: |
| | 139 | {{{ |
| | 140 | d(Q(x))/dx = (-x*DensNormal(x)*DistNormal(x)-DensNormal(x)^2)/DistNormal(x)^2 = |
| | 141 | |
| | 142 | = - DensNormal(x)/DistNormal(x) * (x + DensNormal(x)/DistNormal(x)) |
| | 143 | |
| | 144 | = - Q(x) * (Q(x) + x) |
| | 145 | }}} |