47 | | === Solución determinista === |
48 | | |
49 | | El método utilizado para encontrar la solución determinista |
50 | | (no como variables aleatorias) del sistema es reducir la |
51 | | [http://es.wikipedia.org/wiki/Distancia_de_Mahalanobis distacia de Mahalanobis] |
52 | | de la solución (zA, zB) al punto de partida (muA, muB): |
53 | | |
54 | | {{{ |
55 | | Dist(Mu, Sigma2, Z) = Sqrt((Z-Mu)'·Sigma2**-1·(Z-Mu)) |
56 | | }}} |
57 | | donde Z y Mu son dos vectores columna y Sigma2 una matriz de covarianzas: |
58 | | {{{ |
59 | | Z' = (zA, zB) |
60 | | Mu' = (muA, muB) |
61 | | Sigma2 = ((sigmaA**2, 0), (0, sigmaB**2)) |
62 | | }}} |
63 | | |
64 | | La solución de minimizar la distancia: |
65 | | {{{ |
66 | | Dist(Mu, Sigma2, Z) |
67 | | }}} |
68 | | sujeta al sistema de ecuaciones: |
69 | | {{{ |
70 | | B·Z == C |
71 | | }}} |
72 | | viene dad por: |
73 | | {{{ |
74 | | Z = Sigma2·B' · (B·Sigma2·B')**-1 · (C-B·Mu) + Mu |
75 | | }}} |
76 | | |
77 | | En nuestro ejemplo, las matrices B y C son: |
78 | | {{{ |
79 | | B = (1, -1) |
80 | | C = (0) |
81 | | }}} |
82 | | de modo que la solución encontrada es: |
83 | | {{{ |
84 | | zA = muA + sigmaA**2 * (muB-muA) / (sigmaA**2+sigmaB**2) |
85 | | zB = muB - sigmaB**2 * (muB-muA) / (sigmaA**2+sigmaB**2) |
86 | | }}} |
87 | | y simplificando: |
88 | | {{{ |
89 | | z = zA = zB = (muA * sigmaB**2 + muB * sigmaA**2) / (sigmaA**2 + sigmaB**2) |
90 | | }}} |
91 | | Nótese que este resultado puede verse como una media ponderada con las inversas |
92 | | de las varianzas de los valores muA y muB: |
93 | | {{{ |
94 | | z = (muA * sigmaA**-2 + muB * sigmaB**-2) / (sigmaA**-2 + sigmaB**-2) |
95 | | }}} |
96 | | |
97 | | === Solución como variables aleatorias === |
98 | | |
99 | | Planteamos ahora la solución a la combinación desde un punto de vista estadístico. |
100 | | |
101 | | Dada que la combinación es una igualdad entre dos variables aleatorias, la solución |
102 | | encontrada para una será también la de la otra y la correlación entre ellas será 1. |
103 | | |
104 | | La distribución a posteriori para la variable A viene dada por dos contribuciones: |
105 | | una debida a su información a priori (vA) y otra causada por el sistema de ecuaciones |
106 | | y el resto de información a priori. |
107 | | |
108 | | En este caso sencillo podríamos escribir la función de densidad a posteriori de la |
109 | | variable A (fwA) proporcional al producto de su función de densidad a priori (fvA) y la |
110 | | función de densidad a priori obtenida mediante la ecuación (wA==wB) que no es otra |
111 | | que la función de densidad a priori de la varible B (fvB): |
112 | | |
113 | | {{{ |
114 | | fwA(x) = k * fvA(x) * fvB(x) = k * fNormal(muA, sigmaA, x) * fNormal(muB, sigmaB, x) |
115 | | }}} |
116 | | |
117 | | Se puede comprobar que esta función de densidad es la de una distribución normal: |
118 | | {{{ |
119 | | wA ~ N(muAB, sigmaAB) |
120 | | }}} |
121 | | con los siguientes parámetros: |
122 | | {{{ |
123 | | muAB = (muA * sigmaB**2 + muB * sigmaA**2) / (sigmaA**2 + sigmaB**2) |
124 | | sigmaAB = sigmaA * sigmaB / Sqrt(sigmaA**2 + sigmaB**2) |
125 | | }}} |
126 | | |
127 | | De modo que la solución a la combinación será: |
128 | | {{{ |
129 | | w = wA = wB ~ N(muAB, sigmaAB) |
130 | | }}} |
131 | | |
132 | | En modo matricial podemos representarlo como: |
133 | | {{{ |
134 | | Mu_W' = (muAB, muAB) |
135 | | Sigma2_W = ((sigmaAB, sigmaAB), (sigmaAB, sigmaAB)) |
136 | | }}} |
137 | | |
138 | | Nótese que esta solución nos ofrece como valores medios |
139 | | y también como valores más probables (modas) |
140 | | la solución obtenida minimizando la distancia de Mahalanobis. |
141 | | |
142 | | == Combinación de variables con una sóla ecuación == |
143 | | |
144 | | Otro ejercicio bastante sencillo que podemos imaginar es aquel formado |
145 | | por un conjunto de variables aleatorias (de tipo real) que siguen distribuciones |
146 | | normales (e independientes) sujetas a una restricción formada por una sola ecuación. |
147 | | |
148 | | === Caso de tres variables === |
149 | | |
150 | | Por sencillez trataremos detalladamente el caso de tres variables: |
151 | | |
152 | | Dadas vA, vB y vC (variables a priori): |
153 | | {{{ |
154 | | vA ~ N(muA, sigmaA) |
155 | | vB ~ N(muB, sigmaB) |
156 | | vC ~ N(muC, sigmaC) |
157 | | }}} |
158 | | encontrar las wA, wB y wC (variables a posteriori) que satisfagan: |
159 | | {{{ |
160 | | a*wA + b*wB + c*wC == d |
161 | | }}} |
162 | | |
163 | | === Solución determinista === |
164 | | |
165 | | De acuerdo al método utilizado para encontrar la solución determinista |
166 | | (no como variables aleatorias) del sistema reduciendo la |
167 | | distacia de Mahalanobis de la solución Z al punto de partida Mu: |
168 | | {{{ |
169 | | Z = Sigma2·B' · (B·Sigma2·B')**-1 · (C-B·Mu) + Mu |
170 | | }}} |
171 | | donde: |
172 | | {{{ |
173 | | Z' = (zA, zB, zC) |
174 | | Mu' = (muA, muB, muC) |
175 | | Sigma2 = ((sigmaA**2, 0, 0), (0, sigmaB**2, 0), (0, 0, sigmaC**2)) |
176 | | }}} |
177 | | y utilizando la restricción: |
178 | | {{{ |
179 | | B = ((a, b, c)) |
180 | | C = ((d)) |
181 | | }}} |
182 | | encontramos: |
183 | | {{{ |
184 | | { zA = muA + a * sigmaA**2 * (d - a*muA - b*muB - c*muC) / (a*sigmaA**2 + b*sigmaB**2 + c*sigmaC**2) |
185 | | Z = { zB = muB + b * sigmaB**2 * (d - a*muA - b*muB - c*muC) / (a*sigmaA**2 + b*sigmaB**2 + c*sigmaC**2) |
186 | | { zC = muC + c * sigmaC**2 * (d - a*muA - b*muB - c*muC) / (a*sigmaA**2 + b*sigmaB**2 + c*sigmaC**2) |
187 | | }}} |
188 | | |
189 | | === Solución como variables aleatorias === |
190 | | |
191 | | Como hicimos antes ahora planteamos la solución a la combinación desde un punto de vista estadístico. |
192 | | |
193 | | Dada la simetría de la combinación, la solución para una de las variables nos valdrá para |
194 | | las demás, modificándola convenientemente. |
195 | | |
196 | | La distribución a posteriori para la variable A viene dada por dos contribuciones: |
197 | | una debida a su información a priori (vA) y otra causada por el sistema de ecuaciones |
198 | | y el resto de información a priori. |
199 | | |
200 | | Mientras que en el ejemplo anterior la restricción formaba un espacio con un grado de libertad, |
201 | | en el ejemplo que nos ocupa el espacio tiene dos grados de libertad, de modo que para un valor |
202 | | de la variable A encontramos toda una recta de valores de las variables B y C compatibles. |
203 | | |
204 | | Así pues podemos escribir la función de densidad a posteriori de la |
205 | | variable A (fwA) proporcional al producto de su función de densidad a priori (fvA) y la |
206 | | función de densidad a priori obtenida mediante la ecuación (a*wA+b*wB+c*wC==d) que podemos escribir como: |
207 | | {{{ |
208 | | fvBC(x) = Integrate(fNormal(muB, sigmaB, y) * fNormal(muB, sigmaB, (d-a*x-b*y)/c), {y, -infinite, infinite}) |
209 | | }}} |
210 | | de modo que: |
211 | | {{{ |
212 | | fwA(x) = k * fvA(x) * fvBC(x) = k * fNormal(muA, sigmaA, x) * fvBC(x) |
213 | | }}} |
214 | | |
215 | | Se puede comprobar que esta función de densidad es la de una distribución normal: |
216 | | {{{ |
217 | | wA ~ N(muA_BC, sigmaA_BC) |
218 | | }}} |
219 | | con los siguientes parámetros: |
220 | | {{{ |
221 | | muA_BC = (a * (d - b*muB - c*muC) * sigmaA**2 + muA * ((b*sigmaB)**2 + (c*sigmaC)**2)) / ((a*sigmaA)**2 + (b*sigmaB)**2 + (c*sigmaC)**2) |
222 | | sigmaA_BC = sigmaA * Sqrt((b*sigmaB)**2 + (c*sigmaC)**2) / Sqrt((a*sigmaA)**2 + (b*sigmaB)**2 + (c*sigmaC)**2) |
223 | | }}} |
224 | | |
225 | | Se puede comprobar que esta solución es coherente con el resultado del ejemplo anterior. Usando los valores: |
226 | | a=1, b=-1, c=0 y d=0 se obtiene: |
227 | | {{{ |
228 | | muA_BC = (- muB * sigmaA**2 + muA * sigmaB**2) / (sigmaA**2 + sigmaB**2) |
229 | | sigmaA_BC = sigmaA * sigmaB / Sqrt(sigmaA**2 + sigmaB**2) |
230 | | }}} |
231 | | |
232 | | Utilizando la simetría de la combinación podemos obtener las restantes variables como: |
233 | | {{{ |
234 | | wA ~ N(muA_post, sigmaA_post) |
235 | | wB ~ N(muB_post, sigmaB_post) |
236 | | wC ~ N(muC_post, sigmaC_post) |
237 | | }}} |
238 | | cuyos parámetros se pueden escribir como: |
239 | | {{{ |
240 | | muX_post = (x * (Dm + x*muX) * sigmaX**2 + muX * (S2 - (x*sigmaX)**2)) / (S2) |
241 | | sigmaX_post = sigmaX * Sqrt(S2 - (x*sigmaX)**2) / Sqrt(S2) |
242 | | }}} |
243 | | donde: |
244 | | {{{ |
245 | | S2 := (a*sigmaA)**2 + (b*sigmaB)**2 + (c*sigmaC)**2 |
246 | | Dm := d -a*muA - b*muB - c*muC |
247 | | }}} |
248 | | sustituyendo 'x' y 'X' por 'a', 'b' o 'c' y 'A', 'B' o 'C' respectivamente. |
249 | | |
| 37 | [wiki:Combinations/OneLinearEquation Combinación de variables con una sóla ecuación lineal] |