close
Warning:
Can't synchronize with repository "(default)" (/var/svn/mms does not appear to be a Subversion repository.). Look in the Trac log for more information.
- Timestamp:
-
Jun 6, 2012, 2:03:53 PM (13 years ago)
- Author:
-
Claudia Escalonilla
- Comment:
-
--
Legend:
- Unmodified
- Added
- Removed
- Modified
-
v14
|
v15
|
|
1 | 1 | |
| 2 | {{{ |
| 3 | #!div style="width:50%; margin-left:20%; padding-left:2em; padding-right:2em" |
2 | 4 | |
3 | 5 | = Multicolinealidad = |
… |
… |
|
9 | 11 | ''__Por hacer:__ Llevar las ecuaciones a LaTeX y pulir algunas ideas que están sueltas, incluir referencias.'' |
10 | 12 | |
11 | | Cuando modelamos una variable output {{{Y}}} en función de un regresor lineal múltiple {{{X*beta}}} debemos prestar atención a la presencia de multicolinealidad. La multicolinealidad se presenta cuando las columnas (inputs) de {{{X}}} son linealmente dependientes o existe una alta correlación lineal en un subconjunto de las mismas. |
| 13 | Cuando modelamos una variable output [[LatexEquation(Y)]] en función de un regresor lineal múltiple [[LatexEquation(X\beta)]] debemos prestar atención a la presencia de multicolinealidad. [[BR]] |
| 14 | La multicolinealidad se presenta cuando las columnas (inputs) de [[LatexEquation(X)]] son linealmente dependientes o existe una alta correlación lineal en un subconjunto de las mismas. |
12 | 15 | |
13 | | Un grado grado de multicolinealidad puede conducirnos a una matriz inestable numéricamente y el método de estimación puede fallar. Por otra parte incluso teniendo éxito en la estimación los resultados arrojarán un conjunto de parámetrosa partir de los cuales las interpretaciones serán inexactas, es decir será difícil sustentar el discurso "variando un input mientras el resto se mantiene fijo" ya que ante un alta correlación lineal es imposible variar un input que depende linealmente de otros manteniendo éstos fijo. |
| 16 | Un grado de multicolinealidad puede conducirnos a una matriz inestable numéricamente y el método de estimación puede fallar. [[BR]] |
| 17 | Por otra parte, incluso teniendo éxito en la estimación los resultados arrojarán un conjunto de parámetrosa a partir de los cuales las interpretaciones serán inexactas, es decir, será difícil sustentar el discurso ''"variando un input mientras el resto se mantiene fijo"'' ya que ante una alta correlación lineal es imposible variar un input que depende linealmente de otros manteniendo éstos fijos. |
14 | 18 | |
15 | 19 | En relación a la multicolinealidad se nos presentan dos problemas: |
16 | 20 | |
17 | | 1. imposibilidad de estimar: singularidad numérica |
18 | | 1. difícil interpretación y significatividad baja de los parámetros, perturbaciones pequeñas en los inputs provocan variaciones grandes en los parámetros: quasi-singularidad numérica. |
| 21 | 1. '''Singularidad numérica''': Imposibilidad de estimar. |
| 22 | |
| 23 | 2. '''Quasi-singularidad numérica''': Difícil interpretación y significatividad baja de los parámetros, perturbaciones pequeñas en los inputs provocan variaciones grandes en los parámetros. |
19 | 24 | |
20 | 25 | El primero de los problemas es fácil de detectar: no podemos estimar. |
… |
… |
|
22 | 27 | El segundo de los problemas es más sutil pues incluso podemos tener unas estimaciones donde el ajuste del modelo es bueno. |
23 | 28 | |
24 | | En presencia de una matriz singularidad necesitamos emplear métodos robustos como la descomposición en valores singulares {{{SVD}}}. A partir de la {{{SVD}}} podemos obtener los p valores propios {{{l_1<l_2<...<l_p}}}, cuando l_1 es 0 o "casi 0" la matriz singular o está muy cercana a la singularidad. También se suele analizar el número de condición {{{k(A) = sqrt(l_p/l_1)}}} que tiene a infinito cuando l_1 tiende a 0. |
| 29 | En presencia de una matriz singular necesitamos emplear métodos robustos como la ''descomposición en valores singulares:'' [[LatexEquation(SVD)]]. [[BR]] |
| 30 | A partir de la [[LatexEquation(SVD)]] podemos obtener los p valores propios [[LatexEquation(\lambda_1<\lambda_2< ... <\lambda_p)]], y así, cuando [[LatexEquation(\lamda_1=0)]] o [[LatexEquation(\lamda_1\sim 0)]] se tiene que la matriz es singular o está muy cercana a la singularidad. [[BR]] |
| 31 | También se suele analizar el número de condición [[LatexEquation(K(A) = \sqrt{\frac{\lambda_p}{\lambda_1}})]] que tiende a infinito cuando [[LatexEquation(\lambda_1)]] tiende a 0. |
25 | 32 | |
26 | | La {{{SVD}}} también puede emplearse para determinar subconjuntos de variables con alta correlación .... ¿como? (observando los vectores propios asociados a los valores propios pequeños, estos contienen los coeficientes de la combinación lineal, hay que mirar los coeficiente "distintos" de 0) |
| 33 | La [[LatexEquation(SVD)]] también puede emplearse para determinar subconjuntos de variables con alta correlación .... ¿como? [[BR]] |
| 34 | Observando los vectores propios asociados a los valores propios pequeños (cercanos a 0), éstos contienen los coeficientes de la combinación lineal (hay que mirar los coeficiente "distintos" de 0). |
27 | 35 | |
28 | | Para analizar el grado de multicolinealidad entre las columnas de A cuando A es no singular podemos calcular los estadísticos {{{VIF_i}}} asociado a la columna {{{i}}} ... |
| 36 | Para ''analizar el grado de multicolinealidad'' entre las columnas de A cuando A es no singular podemos calcular los estadísticos [[LatexEquation(VIF_i)]] asociado a la columna [[LatexEquation(i)]]: |
29 | 37 | |
30 | | {{{ |
31 | | X_i = cte + a_1*X_1 + a_2*X_2 + ... + a_{i-1}*X_{i-1} + a_{i+1}*X_{i+1} + ... + a_p*X_p + e |
32 | | VIF_i = 1/(1-(R_i)^2) |
33 | | }}} |
34 | 38 | |
35 | | Valores de {{{VIF}}} grandes indican grado de multicolinealidad alto, se suele usar {{{VIF_i>5}}} |
| 39 | [[LatexEquation( X_i = cte + a_1X_1 + a_2X_2 + ... + a_{i-1}X_{i-1} + a_{i+1}X_{i+1} + ... + a_pX_p + e)]] |
| 40 | [[LatexEquation( VIF_i = \frac{1}{1-R_i^2} )]] |
| 41 | |
| 42 | |
| 43 | Valores de [[LatexEquation(VIF)]] grandes indican grado de multicolinealidad alto, se suele usar [[LatexEquation(VIF_i>5)]] |
36 | 44 | |
37 | 45 | == Propuestas de implementación en MMS == |
… |
… |
|
39 | 47 | ¿Qué ofrecemos en MMS en relación a la multicolinealidad? |
40 | 48 | |
41 | | - cálculo del VIF |
42 | | - cálculo de SVD y selección de variables colineales según tolerancia. |
| 49 | - El cálculo del VIF |
| 50 | - El cálculo de SVD y la selección de variables colineales según la tolerancia. |
43 | 51 | |
44 | 52 | == CheckMulticollinearity == |
… |
… |
|
52 | 60 | }}} |
53 | 61 | |
54 | | El mecanismo tal y como está implementado sólo devuelve el primer problema detectado, de modo que tras solucionar el problema es necesario pasar el chequeo denuevo para ver si aparecen nuevos problemas. |
| 62 | El mecanismo tal y como está implementado sólo devuelve el primer problema detectado, de modo que tras solucionar el problema es necesario pasar el chequeo de nuevo para ver si aparecen nuevos problemas. |
55 | 63 | |
56 | 64 | Se adjunta un ejemplo para observar su funcionamiento. |
| 65 | }}} |