| 47 | | === Solución determinista === |
| 48 | | |
| 49 | | El método utilizado para encontrar la solución determinista |
| 50 | | (no como variables aleatorias) del sistema es reducir la |
| 51 | | [http://es.wikipedia.org/wiki/Distancia_de_Mahalanobis distacia de Mahalanobis] |
| 52 | | de la solución (zA, zB) al punto de partida (muA, muB): |
| 53 | | |
| 54 | | {{{ |
| 55 | | Dist(Mu, Sigma2, Z) = Sqrt((Z-Mu)'·Sigma2**-1·(Z-Mu)) |
| 56 | | }}} |
| 57 | | donde Z y Mu son dos vectores columna y Sigma2 una matriz de covarianzas: |
| 58 | | {{{ |
| 59 | | Z' = (zA, zB) |
| 60 | | Mu' = (muA, muB) |
| 61 | | Sigma2 = ((sigmaA**2, 0), (0, sigmaB**2)) |
| 62 | | }}} |
| 63 | | |
| 64 | | La solución de minimizar la distancia: |
| 65 | | {{{ |
| 66 | | Dist(Mu, Sigma2, Z) |
| 67 | | }}} |
| 68 | | sujeta al sistema de ecuaciones: |
| 69 | | {{{ |
| 70 | | B·Z == C |
| 71 | | }}} |
| 72 | | viene dad por: |
| 73 | | {{{ |
| 74 | | Z = Sigma2·B' · (B·Sigma2·B')**-1 · (C-B·Mu) + Mu |
| 75 | | }}} |
| 76 | | |
| 77 | | En nuestro ejemplo, las matrices B y C son: |
| 78 | | {{{ |
| 79 | | B = (1, -1) |
| 80 | | C = (0) |
| 81 | | }}} |
| 82 | | de modo que la solución encontrada es: |
| 83 | | {{{ |
| 84 | | zA = muA + sigmaA**2 * (muB-muA) / (sigmaA**2+sigmaB**2) |
| 85 | | zB = muB - sigmaB**2 * (muB-muA) / (sigmaA**2+sigmaB**2) |
| 86 | | }}} |
| 87 | | y simplificando: |
| 88 | | {{{ |
| 89 | | z = zA = zB = (muA * sigmaB**2 + muB * sigmaA**2) / (sigmaA**2 + sigmaB**2) |
| 90 | | }}} |
| 91 | | Nótese que este resultado puede verse como una media ponderada con las inversas |
| 92 | | de las varianzas de los valores muA y muB: |
| 93 | | {{{ |
| 94 | | z = (muA * sigmaA**-2 + muB * sigmaB**-2) / (sigmaA**-2 + sigmaB**-2) |
| 95 | | }}} |
| 96 | | |
| 97 | | === Solución como variables aleatorias === |
| 98 | | |
| 99 | | Planteamos ahora la solución a la combinación desde un punto de vista estadístico. |
| 100 | | |
| 101 | | Dada que la combinación es una igualdad entre dos variables aleatorias, la solución |
| 102 | | encontrada para una será también la de la otra y la correlación entre ellas será 1. |
| 103 | | |
| 104 | | La distribución a posteriori para la variable A viene dada por dos contribuciones: |
| 105 | | una debida a su información a priori (vA) y otra causada por el sistema de ecuaciones |
| 106 | | y el resto de información a priori. |
| 107 | | |
| 108 | | En este caso sencillo podríamos escribir la función de densidad a posteriori de la |
| 109 | | variable A (fwA) proporcional al producto de su función de densidad a priori (fvA) y la |
| 110 | | función de densidad a priori obtenida mediante la ecuación (wA==wB) que no es otra |
| 111 | | que la función de densidad a priori de la varible B (fvB): |
| 112 | | |
| 113 | | {{{ |
| 114 | | fwA(x) = k * fvA(x) * fvB(x) = k * fNormal(muA, sigmaA, x) * fNormal(muB, sigmaB, x) |
| 115 | | }}} |
| 116 | | |
| 117 | | Se puede comprobar que esta función de densidad es la de una distribución normal: |
| 118 | | {{{ |
| 119 | | wA ~ N(muAB, sigmaAB) |
| 120 | | }}} |
| 121 | | con los siguientes parámetros: |
| 122 | | {{{ |
| 123 | | muAB = (muA * sigmaB**2 + muB * sigmaA**2) / (sigmaA**2 + sigmaB**2) |
| 124 | | sigmaAB = sigmaA * sigmaB / Sqrt(sigmaA**2 + sigmaB**2) |
| 125 | | }}} |
| 126 | | |
| 127 | | De modo que la solución a la combinación será: |
| 128 | | {{{ |
| 129 | | w = wA = wB ~ N(muAB, sigmaAB) |
| 130 | | }}} |
| 131 | | |
| 132 | | En modo matricial podemos representarlo como: |
| 133 | | {{{ |
| 134 | | Mu_W' = (muAB, muAB) |
| 135 | | Sigma2_W = ((sigmaAB, sigmaAB), (sigmaAB, sigmaAB)) |
| 136 | | }}} |
| 137 | | |
| 138 | | Nótese que esta solución nos ofrece como valores medios |
| 139 | | y también como valores más probables (modas) |
| 140 | | la solución obtenida minimizando la distancia de Mahalanobis. |
| 141 | | |
| 142 | | == Combinación de variables con una sóla ecuación == |
| 143 | | |
| 144 | | Otro ejercicio bastante sencillo que podemos imaginar es aquel formado |
| 145 | | por un conjunto de variables aleatorias (de tipo real) que siguen distribuciones |
| 146 | | normales (e independientes) sujetas a una restricción formada por una sola ecuación. |
| 147 | | |
| 148 | | === Caso de tres variables === |
| 149 | | |
| 150 | | Por sencillez trataremos detalladamente el caso de tres variables: |
| 151 | | |
| 152 | | Dadas vA, vB y vC (variables a priori): |
| 153 | | {{{ |
| 154 | | vA ~ N(muA, sigmaA) |
| 155 | | vB ~ N(muB, sigmaB) |
| 156 | | vC ~ N(muC, sigmaC) |
| 157 | | }}} |
| 158 | | encontrar las wA, wB y wC (variables a posteriori) que satisfagan: |
| 159 | | {{{ |
| 160 | | a*wA + b*wB + c*wC == d |
| 161 | | }}} |
| 162 | | |
| 163 | | === Solución determinista === |
| 164 | | |
| 165 | | De acuerdo al método utilizado para encontrar la solución determinista |
| 166 | | (no como variables aleatorias) del sistema reduciendo la |
| 167 | | distacia de Mahalanobis de la solución Z al punto de partida Mu: |
| 168 | | {{{ |
| 169 | | Z = Sigma2·B' · (B·Sigma2·B')**-1 · (C-B·Mu) + Mu |
| 170 | | }}} |
| 171 | | donde: |
| 172 | | {{{ |
| 173 | | Z' = (zA, zB, zC) |
| 174 | | Mu' = (muA, muB, muC) |
| 175 | | Sigma2 = ((sigmaA**2, 0, 0), (0, sigmaB**2, 0), (0, 0, sigmaC**2)) |
| 176 | | }}} |
| 177 | | y utilizando la restricción: |
| 178 | | {{{ |
| 179 | | B = ((a, b, c)) |
| 180 | | C = ((d)) |
| 181 | | }}} |
| 182 | | encontramos: |
| 183 | | {{{ |
| 184 | | { zA = muA + a * sigmaA**2 * (d - a*muA - b*muB - c*muC) / (a*sigmaA**2 + b*sigmaB**2 + c*sigmaC**2) |
| 185 | | Z = { zB = muB + b * sigmaB**2 * (d - a*muA - b*muB - c*muC) / (a*sigmaA**2 + b*sigmaB**2 + c*sigmaC**2) |
| 186 | | { zC = muC + c * sigmaC**2 * (d - a*muA - b*muB - c*muC) / (a*sigmaA**2 + b*sigmaB**2 + c*sigmaC**2) |
| 187 | | }}} |
| 188 | | |
| 189 | | === Solución como variables aleatorias === |
| 190 | | |
| 191 | | Como hicimos antes ahora planteamos la solución a la combinación desde un punto de vista estadístico. |
| 192 | | |
| 193 | | Dada la simetría de la combinación, la solución para una de las variables nos valdrá para |
| 194 | | las demás, modificándola convenientemente. |
| 195 | | |
| 196 | | La distribución a posteriori para la variable A viene dada por dos contribuciones: |
| 197 | | una debida a su información a priori (vA) y otra causada por el sistema de ecuaciones |
| 198 | | y el resto de información a priori. |
| 199 | | |
| 200 | | Mientras que en el ejemplo anterior la restricción formaba un espacio con un grado de libertad, |
| 201 | | en el ejemplo que nos ocupa el espacio tiene dos grados de libertad, de modo que para un valor |
| 202 | | de la variable A encontramos toda una recta de valores de las variables B y C compatibles. |
| 203 | | |
| 204 | | Así pues podemos escribir la función de densidad a posteriori de la |
| 205 | | variable A (fwA) proporcional al producto de su función de densidad a priori (fvA) y la |
| 206 | | función de densidad a priori obtenida mediante la ecuación (a*wA+b*wB+c*wC==d) que podemos escribir como: |
| 207 | | {{{ |
| 208 | | fvBC(x) = Integrate(fNormal(muB, sigmaB, y) * fNormal(muB, sigmaB, (d-a*x-b*y)/c), {y, -infinite, infinite}) |
| 209 | | }}} |
| 210 | | de modo que: |
| 211 | | {{{ |
| 212 | | fwA(x) = k * fvA(x) * fvBC(x) = k * fNormal(muA, sigmaA, x) * fvBC(x) |
| 213 | | }}} |
| 214 | | |
| 215 | | Se puede comprobar que esta función de densidad es la de una distribución normal: |
| 216 | | {{{ |
| 217 | | wA ~ N(muA_BC, sigmaA_BC) |
| 218 | | }}} |
| 219 | | con los siguientes parámetros: |
| 220 | | {{{ |
| 221 | | muA_BC = (a * (d - b*muB - c*muC) * sigmaA**2 + muA * ((b*sigmaB)**2 + (c*sigmaC)**2)) / ((a*sigmaA)**2 + (b*sigmaB)**2 + (c*sigmaC)**2) |
| 222 | | sigmaA_BC = sigmaA * Sqrt((b*sigmaB)**2 + (c*sigmaC)**2) / Sqrt((a*sigmaA)**2 + (b*sigmaB)**2 + (c*sigmaC)**2) |
| 223 | | }}} |
| 224 | | |
| 225 | | Se puede comprobar que esta solución es coherente con el resultado del ejemplo anterior. Usando los valores: |
| 226 | | a=1, b=-1, c=0 y d=0 se obtiene: |
| 227 | | {{{ |
| 228 | | muA_BC = (- muB * sigmaA**2 + muA * sigmaB**2) / (sigmaA**2 + sigmaB**2) |
| 229 | | sigmaA_BC = sigmaA * sigmaB / Sqrt(sigmaA**2 + sigmaB**2) |
| 230 | | }}} |
| 231 | | |
| 232 | | Utilizando la simetría de la combinación podemos obtener las restantes variables como: |
| 233 | | {{{ |
| 234 | | wA ~ N(muA_post, sigmaA_post) |
| 235 | | wB ~ N(muB_post, sigmaB_post) |
| 236 | | wC ~ N(muC_post, sigmaC_post) |
| 237 | | }}} |
| 238 | | cuyos parámetros se pueden escribir como: |
| 239 | | {{{ |
| 240 | | muX_post = (x * (Dm + x*muX) * sigmaX**2 + muX * (S2 - (x*sigmaX)**2)) / (S2) |
| 241 | | sigmaX_post = sigmaX * Sqrt(S2 - (x*sigmaX)**2) / Sqrt(S2) |
| 242 | | }}} |
| 243 | | donde: |
| 244 | | {{{ |
| 245 | | S2 := (a*sigmaA)**2 + (b*sigmaB)**2 + (c*sigmaC)**2 |
| 246 | | Dm := d -a*muA - b*muB - c*muC |
| 247 | | }}} |
| 248 | | sustituyendo 'x' y 'X' por 'a', 'b' o 'c' y 'A', 'B' o 'C' respectivamente. |
| 249 | | |
| | 37 | [wiki:Combinations/OneLinearEquation Combinación de variables con una sóla ecuación lineal] |