| 72 | |
| 73 | |
| 74 | == Modelo Probit == |
| 75 | |
| 76 | La función de enlace del modelo probit es la inversa de la función de distribución normal (con parámetros: media 0 y varianza 1): |
| 77 | {{{ |
| 78 | Probit(p) = InvDistNormal(p) |
| 79 | }}} |
| 80 | cuya inversa es: |
| 81 | {{{ |
| 82 | InvProbit(z) = DistNormal(z) |
| 83 | }}} |
| 84 | |
| 85 | Así, la primera derivada de la inversa de la función de enlace, no es otra que la función de densidad normal: |
| 86 | {{{ |
| 87 | d(InvProbit(z))/dz = DensNormal(z) = 1/Sqrt(2Pi) * Exp(-z^2/2) |
| 88 | }}} |
| 89 | |
| 90 | === Verosimilitud y derivadas === |
| 91 | |
| 92 | ==== Log-Likelihood ==== |
| 93 | |
| 94 | El logaritmo de la verosimilitud (''log-likelihood'') es: |
| 95 | {{{ |
| 96 | LogL = Sum_i( Y_i*Log(P_i) + (1-Y_i)*Log(1-P_i) ) |
| 97 | }}} |
| 98 | donde el subíndice {{{i}}} hace referencia a la {{{i}}}-ésima observación. |
| 99 | |
| 100 | Teniendo en cuenta que la probabilidad de la {{{i}}}-ésima observación viene dada por: |
| 101 | {{{ |
| 102 | P_i = DistNormal(B'X_i) |
| 103 | }}} |
| 104 | podemos escribir: |
| 105 | {{{ |
| 106 | LogL = Sum_i( Y_i*Log(DistNormal(B'X_i)) + (1-Y_i)*Log(1-DistNormal(B'X_i)) ) = |
| 107 | |
| 108 | = Sum_i( Y_i*Log(DistNormal(B'X_i)) + (1-Y_i)*Log(DistNormal(-B'X_i)) ) |
| 109 | }}} |
| 110 | |
| 111 | ==== Gradient ==== |
| 112 | |
| 113 | La primera derivada respecto a la matriz de parámetros ({{{B}}}) es el gradiente del logaritmo de la verosimilitud: |
| 114 | |
| 115 | {{{ |
| 116 | G(B) = d(LogL(B))/dB = |
| 117 | |
| 118 | = Sum_i( ( Y_i*DensNormal(B'X_i)/DistNormal(B'X_i) - (1-Y_i)*DensNormal(-B'X_i)/DistNormal(-B'X_i) ) * X_i ) |
| 119 | |
| 120 | = Sum_i( ( Y_i*Q(B'X_i) - (1-Y_i)*Q(-B'X_i) ) * X_i ) |
| 121 | }}} |
| 122 | |
| 123 | donde el cociente entre las funciones de densidad y distribución se ha definido como: |
| 124 | {{{ |
| 125 | Q(x) = DensNormal(x)/DistNormal(x) |
| 126 | }}} |
| 127 | |
| 128 | ==== Hessian ==== |
| 129 | |
| 130 | La segunda derivada respecto a la matriz de parámetros ({{{B}}}) es la hessiana del logaritmo de la verosimilitud: |
| 131 | |
| 132 | {{{ |
| 133 | H(B) = d^2(LogL(B))/(dB dB') = |
| 134 | |
| 135 | = Sum_i( ( Y_i*Q(B'X_i)*(Q(B'X_i)+B'X_i) + (1-Y_i)*Q(-B'X_i)*(Q(-B'X_i)-B'X_i) ) * X_i * X'_i ) |
| 136 | }}} |
| 137 | |
| 138 | donde se usado que: |
| 139 | {{{ |
| 140 | d(Q(x))/dx = (-x*DensNormal(x)*DistNormal(x)-DensNormal(x)^2)/DistNormal(x)^2 = |
| 141 | |
| 142 | = - DensNormal(x)/DistNormal(x) * (x + DensNormal(x)/DistNormal(x)) |
| 143 | |
| 144 | = - Q(x) * (Q(x) + x) |
| 145 | }}} |