| 1 | |
| 2 | = Combinación de variables aleatorias = |
| 3 | |
| 4 | == Igualdad de variables aleatorias == |
| 5 | |
| 6 | El ejercicio más simple (no trivial) que podemos imaginar es aquel formado |
| 7 | por dos variables aleatorias (de tipo real) que siguen sendas distribuciones |
| 8 | normales (e independientes) sujeta a la restricción de ser iguales. |
| 9 | |
| 10 | Dadas vA y vB (variables a priori): |
| 11 | {{{ |
| 12 | vA ~ N(muA, sigmaA) |
| 13 | vB ~ N(muB, sigmaB) |
| 14 | }}} |
| 15 | encontrar las wA y wB (variables a posteriori) que satisfagan: |
| 16 | {{{ |
| 17 | wA == wB |
| 18 | }}} |
| 19 | |
| 20 | === Solución determinista === |
| 21 | |
| 22 | El método utilizado para encontrar la solución determinista |
| 23 | (no como variables aleatorias) del sistema es reducir la |
| 24 | [http://es.wikipedia.org/wiki/Distancia_de_Mahalanobis distacia de Mahalanobis] |
| 25 | de la solución (zA, zB) al punto de partida (muA, muB): |
| 26 | |
| 27 | {{{ |
| 28 | Dist(Mu, Sigma2, Z) = Sqrt((Z-Mu)'·Sigma2**-1·(Z-Mu)) |
| 29 | }}} |
| 30 | donde Z y Mu son dos vectores columna y Sigma2 una matriz de covarianzas: |
| 31 | {{{ |
| 32 | Z' = (zA, zB) |
| 33 | Mu' = (muA, muB) |
| 34 | Sigma2 = ((sigmaA**2, 0), (0, sigmaB**2)) |
| 35 | }}} |
| 36 | |
| 37 | La solución de minimizar la distancia: |
| 38 | {{{ |
| 39 | Dist(Mu, Sigma2, Z) |
| 40 | }}} |
| 41 | sujeta al sistema de ecuaciones: |
| 42 | {{{ |
| 43 | B·Z == C |
| 44 | }}} |
| 45 | viene dad por: |
| 46 | {{{ |
| 47 | Z = Sigma2·B' · (B·Sigma2·B')**-1 · (C-B·Mu) + Mu |
| 48 | }}} |
| 49 | |
| 50 | En nuestro ejemplo, las matrices B y C son: |
| 51 | {{{ |
| 52 | B = (1, -1) |
| 53 | C = (0) |
| 54 | }}} |
| 55 | de modo que la solución encontrada es: |
| 56 | {{{ |
| 57 | zA = muA + sigmaA**2 * (muB-muA) / (sigmaA**2+sigmaB**2) |
| 58 | zB = muB - sigmaB**2 * (muB-muA) / (sigmaA**2+sigmaB**2) |
| 59 | }}} |
| 60 | y simplificando: |
| 61 | {{{ |
| 62 | z = zA = zB = (muA * sigmaB**2 + muB * sigmaA**2) / (sigmaA**2 + sigmaB**2) |
| 63 | }}} |
| 64 | Nótese que este resultado puede verse como una media ponderada con las inversas |
| 65 | de las varianzas de los valores muA y muB: |
| 66 | {{{ |
| 67 | z = (muA * sigmaA**-2 + muB * sigmaB**-2) / (sigmaA**-2 + sigmaB**-2) |
| 68 | }}} |
| 69 | |
| 70 | === Solución como variables aleatorias === |
| 71 | |
| 72 | Planteamos ahora la solución a la combinación desde un punto de vista estadístico. |
| 73 | |
| 74 | Dada que la combinación es una igualdad entre dos variables aleatorias, la solución |
| 75 | encontrada para una será también la de la otra y la correlación entre ellas será 1. |
| 76 | |
| 77 | La distribución a posteriori para la variable A viene dada por dos contribuciones: |
| 78 | una debida a su información a priori (vA) y otra causada por el sistema de ecuaciones |
| 79 | y el resto de información a priori. |
| 80 | |
| 81 | En este caso sencillo podríamos escribir la función de densidad a posteriori de la |
| 82 | variable A (fwA) proporcional al producto de su función de densidad a priori (fvA) y la |
| 83 | función de densidad a priori obtenida mediante la ecuación (wA==wB) que no es otra |
| 84 | que la función de densidad a priori de la varible B (fvB): |
| 85 | |
| 86 | {{{ |
| 87 | fwA(x) = k * fvA(x) * fvB(x) = k * fNormal(muA, sigmaA, x) * fNormal(muB, sigmaB, x) |
| 88 | }}} |
| 89 | |
| 90 | Se puede comprobar que esta función de densidad es la de una distribución normal: |
| 91 | {{{ |
| 92 | wA ~ N(muAB, sigmaAB) |
| 93 | }}} |
| 94 | con los siguientes parámetros: |
| 95 | {{{ |
| 96 | muAB = (muA * sigmaB**2 + muB * sigmaA**2) / (sigmaA**2 + sigmaB**2) |
| 97 | sigmaAB = sigmaA * sigmaB / Sqrt(sigmaA**2 + sigmaB**2) |
| 98 | }}} |
| 99 | |
| 100 | De modo que la solución a la combinación será: |
| 101 | {{{ |
| 102 | w = wA = wB ~ N(muAB, sigmaAB) |
| 103 | }}} |
| 104 | |
| 105 | En modo matricial podemos representarlo como: |
| 106 | {{{ |
| 107 | Mu_W' = (muAB, muAB) |
| 108 | Sigma2_W = ((sigmaAB, sigmaAB), (sigmaAB, sigmaAB)) |
| 109 | }}} |
| 110 | |
| 111 | Nótese que esta solución nos ofrece como valores medios |
| 112 | y también como valores más probables (modas) |
| 113 | la solución obtenida minimizando la distancia de Mahalanobis. |