close Warning: Can't synchronize with repository "(default)" (/var/svn/mms does not appear to be a Subversion repository.). Look in the Trac log for more information.

Changes between Version 4 and Version 5 of GLM


Ignore:
Timestamp:
Aug 7, 2014, 11:17:51 AM (10 years ago)
Author:
Pedro Gea
Comment:

--

Legend:

Unmodified
Added
Removed
Modified
  • GLM

    v4 v5  
    2222InvLogit(z) = 1/(1+Exp(-z)) = Exp(z)/(Exp(z)+1)
    2323}}}
     24conocida como la función de distribución logística.
    2425
    2526=== Verosimilitud y derivadas ===
     
    6970     = - Sum_i( Exp(B'X_i)/(1+Exp(B'X_i))^2 * X_i * X'_i )
    7071}}}
     72
     73
     74== Modelo Probit ==
     75
     76La función de enlace del modelo probit es la inversa de la función de distribución normal (con parámetros: media 0 y varianza 1):
     77{{{
     78Probit(p) = InvDistNormal(p)
     79}}}
     80cuya inversa es:
     81{{{
     82InvProbit(z) = DistNormal(z)
     83}}}
     84
     85Así, la primera derivada de la inversa de la función de enlace, no es otra que la función de densidad normal:
     86{{{
     87d(InvProbit(z))/dz = DensNormal(z) = 1/Sqrt(2Pi) * Exp(-z^2/2)
     88}}}
     89
     90=== Verosimilitud y derivadas ===
     91
     92==== Log-Likelihood ====
     93
     94El logaritmo de la verosimilitud (''log-likelihood'') es:
     95{{{
     96LogL = Sum_i( Y_i*Log(P_i) + (1-Y_i)*Log(1-P_i) )
     97}}}
     98donde el subíndice {{{i}}} hace referencia a la {{{i}}}-ésima observación.
     99
     100Teniendo en cuenta que la probabilidad de la {{{i}}}-ésima observación viene dada por:
     101{{{
     102P_i = DistNormal(B'X_i)
     103}}}
     104podemos escribir:
     105{{{
     106LogL = Sum_i( Y_i*Log(DistNormal(B'X_i)) + (1-Y_i)*Log(1-DistNormal(B'X_i)) ) =
     107
     108     = Sum_i( Y_i*Log(DistNormal(B'X_i)) + (1-Y_i)*Log(DistNormal(-B'X_i)) )
     109}}}
     110
     111==== Gradient ====
     112
     113La primera derivada respecto a la matriz de parámetros ({{{B}}}) es el gradiente del logaritmo de la verosimilitud:
     114
     115{{{
     116G(B) = d(LogL(B))/dB =
     117
     118     = Sum_i( ( Y_i*DensNormal(B'X_i)/DistNormal(B'X_i) - (1-Y_i)*DensNormal(-B'X_i)/DistNormal(-B'X_i) ) * X_i )
     119
     120     = Sum_i( ( Y_i*Q(B'X_i) - (1-Y_i)*Q(-B'X_i) ) * X_i )
     121}}}
     122
     123donde el cociente entre las funciones de densidad y distribución se ha definido como:
     124{{{
     125Q(x) = DensNormal(x)/DistNormal(x)
     126}}}
     127
     128==== Hessian ====
     129
     130La segunda derivada respecto a la matriz de parámetros ({{{B}}}) es la hessiana del logaritmo de la verosimilitud:
     131
     132{{{
     133H(B) = d^2(LogL(B))/(dB dB') =
     134
     135     = Sum_i( ( Y_i*Q(B'X_i)*(Q(B'X_i)+B'X_i) + (1-Y_i)*Q(-B'X_i)*(Q(-B'X_i)-B'X_i) ) * X_i * X'_i )
     136}}}
     137
     138donde se usado que:
     139{{{
     140d(Q(x))/dx = (-x*DensNormal(x)*DistNormal(x)-DensNormal(x)^2)/DistNormal(x)^2 =
     141
     142           = - DensNormal(x)/DistNormal(x) * (x + DensNormal(x)/DistNormal(x))
     143
     144           = - Q(x) * (Q(x) + x)
     145}}}