Context Navigation

close Warning: Can't synchronize with repository "(default)" (/var/svn/mms does not appear to be a Subversion repository.). Look in the Trac log for more information.

Changes between Version 4 and Version 5 of GLM

Timestamp:: Aug 7, 2014, 11:17:51 AM (12 years ago)
Author:: Pedro Gea
Comment:: --

Legend:

: Unmodified
: Added
: Removed
: Modified

GLM

-                      v4
+                      v5
 InvLogit(z) = 1/(1+Exp(-z)) = Exp(z)/(Exp(z)+1)
 }}}
+conocida como la función de distribución logística.
 === Verosimilitud y derivadas ===
 …
      = - Sum_i( Exp(B'X_i)/(1+Exp(B'X_i))^2 * X_i * X'_i )
 }}}
+== Modelo Probit ==
+La función de enlace del modelo probit es la inversa de la función de distribución normal (con parámetros: media 0 y varianza 1):
+{{{
+Probit(p) = InvDistNormal(p)
+}}}
+cuya inversa es:
+{{{
+InvProbit(z) = DistNormal(z)
+}}}
+Así, la primera derivada de la inversa de la función de enlace, no es otra que la función de densidad normal:
+{{{
+d(InvProbit(z))/dz = DensNormal(z) = 1/Sqrt(2Pi) * Exp(-z^2/2)
+}}}
+=== Verosimilitud y derivadas ===
+==== Log-Likelihood ====
+El logaritmo de la verosimilitud (''log-likelihood'') es:
+{{{
+LogL = Sum_i( Y_i*Log(P_i) + (1-Y_i)*Log(1-P_i) )
+}}}
+donde el subíndice {{{i}}} hace referencia a la {{{i}}}-ésima observación.
+Teniendo en cuenta que la probabilidad de la {{{i}}}-ésima observación viene dada por:
+{{{
+P_i = DistNormal(B'X_i)
+}}}
+podemos escribir:
+{{{
+LogL = Sum_i( Y_i*Log(DistNormal(B'X_i)) + (1-Y_i)*Log(1-DistNormal(B'X_i)) ) =
+     = Sum_i( Y_i*Log(DistNormal(B'X_i)) + (1-Y_i)*Log(DistNormal(-B'X_i)) )
+}}}
+==== Gradient ====
+La primera derivada respecto a la matriz de parámetros ({{{B}}}) es el gradiente del logaritmo de la verosimilitud:
+{{{
+G(B) = d(LogL(B))/dB =
+     = Sum_i( ( Y_i*DensNormal(B'X_i)/DistNormal(B'X_i) - (1-Y_i)*DensNormal(-B'X_i)/DistNormal(-B'X_i) ) * X_i )
+     = Sum_i( ( Y_i*Q(B'X_i) - (1-Y_i)*Q(-B'X_i) ) * X_i )
+}}}
+donde el cociente entre las funciones de densidad y distribución se ha definido como:
+{{{
+Q(x) = DensNormal(x)/DistNormal(x)
+}}}
+==== Hessian ====
+La segunda derivada respecto a la matriz de parámetros ({{{B}}}) es la hessiana del logaritmo de la verosimilitud:
+{{{
+H(B) = d^2(LogL(B))/(dB dB') =
+     = Sum_i( ( Y_i*Q(B'X_i)*(Q(B'X_i)+B'X_i) + (1-Y_i)*Q(-B'X_i)*(Q(-B'X_i)-B'X_i) ) * X_i * X'_i )
+}}}
+donde se usado que:
+{{{
+d(Q(x))/dx = (-x*DensNormal(x)*DistNormal(x)-DensNormal(x)^2)/DistNormal(x)^2 =
+           = - DensNormal(x)/DistNormal(x) * (x + DensNormal(x)/DistNormal(x))
+           = - Q(x) * (Q(x) + x)
+}}}