close Warning: Can't synchronize with repository "(default)" (/var/svn/mms does not appear to be a Subversion repository.). Look in the Trac log for more information.

Changes between Version 14 and Version 15 of Multicollinearity


Ignore:
Timestamp:
Jun 6, 2012, 2:03:53 PM (13 years ago)
Author:
Claudia Escalonilla
Comment:

--

Legend:

Unmodified
Added
Removed
Modified
  • Multicollinearity

    v14 v15  
    11
     2{{{
     3#!div style="width:50%; margin-left:20%; padding-left:2em; padding-right:2em"
    24
    35= Multicolinealidad =
     
    911''__Por hacer:__ Llevar las ecuaciones a LaTeX y pulir algunas ideas que están sueltas, incluir referencias.''
    1012
    11 Cuando modelamos una variable output {{{Y}}} en función de un regresor lineal múltiple {{{X*beta}}} debemos prestar atención a la presencia de multicolinealidad. La multicolinealidad se presenta cuando las columnas (inputs) de  {{{X}}} son linealmente dependientes o existe una alta correlación lineal en un subconjunto de las mismas.
     13Cuando modelamos una variable output [[LatexEquation(Y)]] en función de un regresor lineal múltiple [[LatexEquation(X\beta)]] debemos prestar atención a la presencia de multicolinealidad. [[BR]]
     14La multicolinealidad se presenta cuando las columnas (inputs) de [[LatexEquation(X)]] son linealmente dependientes o existe una alta correlación lineal en un subconjunto de las mismas.
    1215
    13 Un grado grado de multicolinealidad puede conducirnos a una matriz inestable numéricamente y el método de estimación puede fallar. Por otra parte incluso teniendo éxito en la estimación los resultados arrojarán un conjunto de parámetrosa partir de los cuales las interpretaciones serán inexactas, es decir será difícil sustentar el discurso "variando un input mientras el resto se mantiene fijo" ya que ante un alta correlación lineal es imposible variar un input que depende linealmente de otros manteniendo éstos fijo.
     16Un grado de multicolinealidad puede conducirnos a una matriz inestable numéricamente y el método de estimación puede fallar. [[BR]]
     17Por otra parte, incluso teniendo éxito en la estimación los resultados arrojarán un conjunto de parámetrosa a partir de los cuales las interpretaciones serán inexactas, es decir, será difícil sustentar el discurso ''"variando un input mientras el resto se mantiene fijo"'' ya que ante una alta correlación lineal es imposible variar un input que depende linealmente de otros manteniendo éstos fijos.
    1418
    1519En relación a la multicolinealidad se nos presentan dos problemas:
    1620
    17  1. imposibilidad de estimar: singularidad numérica
    18  1. difícil interpretación y significatividad baja de los parámetros, perturbaciones pequeñas en los inputs provocan variaciones grandes en los parámetros: quasi-singularidad numérica.
     21 1. '''Singularidad numérica''': Imposibilidad de estimar.
     22
     23 2. '''Quasi-singularidad numérica''': Difícil interpretación y significatividad baja de los parámetros, perturbaciones pequeñas en los inputs provocan variaciones grandes en los parámetros.
    1924
    2025El primero de los problemas es fácil de detectar: no podemos estimar.
     
    2227El segundo de los problemas es más sutil pues incluso podemos tener unas estimaciones donde el ajuste del modelo es bueno.
    2328
    24 En presencia de una matriz singularidad necesitamos emplear métodos robustos como la descomposición en valores singulares {{{SVD}}}. A partir de la {{{SVD}}} podemos obtener los p valores propios {{{l_1<l_2<...<l_p}}}, cuando l_1 es 0 o "casi 0" la matriz singular o está muy cercana a la singularidad. También se suele analizar el número de condición {{{k(A) = sqrt(l_p/l_1)}}} que tiene a infinito cuando l_1 tiende a 0.
     29En presencia de una matriz singular necesitamos emplear métodos robustos como la ''descomposición en valores singulares:'' [[LatexEquation(SVD)]]. [[BR]]
     30A partir de la [[LatexEquation(SVD)]] podemos obtener los p valores propios [[LatexEquation(\lambda_1<\lambda_2< ... <\lambda_p)]], y así, cuando [[LatexEquation(\lamda_1=0)]] o [[LatexEquation(\lamda_1\sim 0)]] se tiene que la matriz es singular o está muy cercana a la singularidad. [[BR]]
     31También se suele analizar el número de condición [[LatexEquation(K(A) = \sqrt{\frac{\lambda_p}{\lambda_1}})]] que tiende a infinito cuando [[LatexEquation(\lambda_1)]] tiende a 0.
    2532
    26 La {{{SVD}}} también puede emplearse para determinar subconjuntos de variables con alta correlación .... ¿como? (observando los vectores propios asociados a los valores propios pequeños, estos contienen los coeficientes de la combinación lineal, hay que mirar los coeficiente "distintos" de 0)
     33La [[LatexEquation(SVD)]] también puede emplearse para determinar subconjuntos de variables con alta correlación .... ¿como? [[BR]]
     34Observando los vectores propios asociados a los valores propios pequeños (cercanos a 0), éstos contienen los coeficientes de la combinación lineal (hay que mirar los coeficiente "distintos" de 0).
    2735
    28 Para analizar el grado de multicolinealidad entre las columnas de A cuando A es no singular podemos calcular los estadísticos {{{VIF_i}}} asociado a la columna {{{i}}} ...
     36Para ''analizar el grado de multicolinealidad'' entre las columnas de A cuando A es no singular podemos calcular los estadísticos [[LatexEquation(VIF_i)]]  asociado a la columna [[LatexEquation(i)]]:
    2937
    30 {{{
    31   X_i = cte + a_1*X_1 + a_2*X_2 + ... + a_{i-1}*X_{i-1} + a_{i+1}*X_{i+1} + ... + a_p*X_p + e
    32   VIF_i = 1/(1-(R_i)^2)
    33 }}}
    3438
    35 Valores de {{{VIF}}} grandes indican grado de multicolinealidad alto, se suele usar {{{VIF_i>5}}}
     39[[LatexEquation( X_i = cte + a_1X_1 + a_2X_2 + ... + a_{i-1}X_{i-1} + a_{i+1}X_{i+1} + ... + a_pX_p + e)]]
     40[[LatexEquation( VIF_i = \frac{1}{1-R_i^2} )]]
     41
     42
     43Valores de [[LatexEquation(VIF)]] grandes indican grado de multicolinealidad alto, se suele usar [[LatexEquation(VIF_i>5)]]
    3644
    3745== Propuestas de implementación en MMS ==
     
    3947¿Qué ofrecemos en MMS en relación a la multicolinealidad?
    4048
    41  - cálculo del VIF
    42  - cálculo de SVD y selección de variables colineales según tolerancia.
     49 - El cálculo del VIF
     50 - El cálculo de SVD y la selección de variables colineales según la tolerancia.
    4351
    4452== CheckMulticollinearity ==
     
    5260}}}
    5361
    54 El mecanismo tal y como está implementado sólo devuelve el primer problema detectado, de modo que tras solucionar el problema es necesario pasar el chequeo denuevo para ver si aparecen nuevos problemas.
     62El mecanismo tal y como está implementado sólo devuelve el primer problema detectado, de modo que tras solucionar el problema es necesario pasar el chequeo de nuevo para ver si aparecen nuevos problemas.
    5563
    5664Se adjunta un ejemplo para observar su funcionamiento.
     65}}}