Combinación de variables aleatorias
Combinación de variables con una sola ecuación lineal
Otro ejercicio bastante sencillo que podemos imaginar es aquel formado por un conjunto de variables aleatorias (de tipo real) que siguen distribuciones normales (e independientes) sujetas a una restricción formada por una sola ecuación.
Caso de tres variables
Por sencillez trataremos detalladamente el caso de tres variables:
Dadas vA, vB y vC (variables a priori):
vA ~ N(muA, sigmaA) vB ~ N(muB, sigmaB) vC ~ N(muC, sigmaC)
encontrar las wA, wB y wC (variables a posteriori) que satisfagan:
a*wA + b*wB + c*wC == d
Solución determinista
De acuerdo al método utilizado para encontrar la solución determinista (no como variables aleatorias) del sistema reduciendo la distacia de Mahalanobis de la solución Z al punto de partida Mu:
Z = Sigma2·B' · (B·Sigma2·B')**-1 · (C-B·Mu) + Mu
donde:
Z' = (zA, zB, zC) Mu' = (muA, muB, muC) Sigma2 = ((sigmaA**2, 0, 0), (0, sigmaB**2, 0), (0, 0, sigmaC**2))
y utilizando la restricción:
B = ((a, b, c)) C = ((d))
encontramos:
{ zA = muA + a * sigmaA**2 * (d - a*muA - b*muB - c*muC) / (a*sigmaA**2 + b*sigmaB**2 + c*sigmaC**2) Z = { zB = muB + b * sigmaB**2 * (d - a*muA - b*muB - c*muC) / (a*sigmaA**2 + b*sigmaB**2 + c*sigmaC**2) { zC = muC + c * sigmaC**2 * (d - a*muA - b*muB - c*muC) / (a*sigmaA**2 + b*sigmaB**2 + c*sigmaC**2)
Solución como variables aleatorias
Como hicimos antes ahora planteamos la solución a la combinación desde un punto de vista estadístico.
Dada la simetría de la combinación, la solución para una de las variables nos valdrá para las demás, modificándola convenientemente.
La distribución a posteriori para la variable A viene dada por dos contribuciones: una debida a su información a priori (vA) y otra causada por el sistema de ecuaciones y el resto de información a priori.
Mientras que en el ejemplo anterior la restricción formaba un espacio con un grado de libertad, en el ejemplo que nos ocupa el espacio tiene dos grados de libertad, de modo que para un valor de la variable A encontramos toda una recta de valores de las variables B y C compatibles.
Así pues podemos escribir la función de densidad a posteriori de la variable A (fwA) proporcional al producto de su función de densidad a priori (fvA) y la función de densidad a priori obtenida mediante la ecuación (a*wA+b*wB+c*wC==d) que podemos escribir como:
fvBC(x) = Integrate(fNormal(muB, sigmaB, y) * fNormal(muC, sigmaC, (d-a*x-b*y)/c), {y, -infinite, infinite})
de modo que:
fwA(x) = k * fvA(x) * fvBC(x) = k * fNormal(muA, sigmaA, x) * fvBC(x)
Se puede comprobar que esta función de densidad es la de una distribución normal:
wA ~ N(muA_BC, sigmaA_BC)
con los siguientes parámetros:
muA_BC = (a * (d - b*muB - c*muC) * sigmaA**2 + muA * ((b*sigmaB)**2 + (c*sigmaC)**2)) / ((a*sigmaA)**2 + (b*sigmaB)**2 + (c*sigmaC)**2) sigmaA_BC = sigmaA * Sqrt((b*sigmaB)**2 + (c*sigmaC)**2) / Sqrt((a*sigmaA)**2 + (b*sigmaB)**2 + (c*sigmaC)**2)
Se puede comprobar que esta solución es coherente con el resultado del ejemplo anterior. Usando los valores: a=1, b=-1, c=0 y d=0 se obtiene:
muA_BC = (- muB * sigmaA**2 + muA * sigmaB**2) / (sigmaA**2 + sigmaB**2) sigmaA_BC = sigmaA * sigmaB / Sqrt(sigmaA**2 + sigmaB**2)
Utilizando la simetría de la combinación podemos obtener las restantes variables como:
wA ~ N(muA_post, sigmaA_post) wB ~ N(muB_post, sigmaB_post) wC ~ N(muC_post, sigmaC_post)
cuyos parámetros se pueden escribir como:
muX_post = (x * (Dm + x*muX) * sigmaX**2 + muX * (S2 - (x*sigmaX)**2)) / (S2) sigmaX_post = sigmaX * Sqrt(S2 - (x*sigmaX)**2) / Sqrt(S2)
donde:
S2 := (a*sigmaA)**2 + (b*sigmaB)**2 + (c*sigmaC)**2 Dm := d -a*muA - b*muB - c*muC
sustituyendo 'x' y 'X' por 'a', 'b' o 'c' y 'A', 'B' o 'C' respectivamente.
Para ver algunos resultados utilizados en los cálculos véanse las siguientes notas matemáticas.