wiki:Combinations

Context Navigation

close Warning: Can't synchronize with repository "(default)" (/var/svn/mms does not appear to be a Subversion repository.). Look in the Trac log for more information.

Version 8 (modified by Pedro Gea, 16 years ago) (diff)
--

Combinaciones de variables aleatorias. Combinaciones de previsiones

Definición

Las combinaciones de previsiones, y en general de variables aleatorias, se definen como un sistema de ecuaciones lineales (generalmente indeterminado) sobre un conjunto de variables aleatorias (o previsiones) para las que se dispone información a priori sobre su distribución.

El sistema de ecuaciones lineales habitualmente es compatible indeterminado, dando lugar a un espacio de soluciones con varios grados de libertad.

Comúnmente la solución de la combinación se plantea como aquélla que satisfaciendo el sistema de ecuaciones es más cercana (según la distacia de Mahalanobis) a las medias a priori de las variables aleatorias.

Formalmente la solución sería un conjunto de variables aleatorias restringida al espacio de soluciones y cuya distribución de probabilidad está condicionada a las distribuciones de partida o a priori.

(¡VERIFICAR QUE ESTO ES CIERTO!) Merece la pena mencionar que la solución determinista encontrada al minimizar la distancia de Mahalanobis coincide con la solución formada por las medias de estas distribuciones a posteriori de las variables aleatorias.

A continuación planteamos el ejercicio de combinaciones más simple que podemos imaginar y que puede sernos útil para aclarar conceptos y para encontrar algunos resultados que pueden extenderse a combinaciones más complejas.

Igualdad de variables aleatorias

El ejercicio más simple (no trivial) que podemos imaginar es aquel formado por dos variables aleatorias (de tipo real) que siguen sendas distribuciones normales (e independientes) sujeta a la restricción de ser iguales.

Dadas vA y vB (variables a priori):

vA ~ N(muA, sigmaA)
vB ~ N(muB, sigmaB)

encontrar las wA y wB (variables a posteriori) que satisfagan:

wA == wB

Solución determinista

El método utilizado para encontrar la solución determinista (no como variables aleatorias) del sistema es reducir la distacia de Mahalanobis de la solución (zA, zB) al punto de partida (muA, muB):

Dist(Mu, Sigma2, Z) = Sqrt((Z-Mu)'·Sigma2**-1·(Z-Mu))

donde Z y Mu son dos vectores columna y Sigma2 una matriz de covarianzas:

Z' = (zA, zB)
Mu' = (muA, muB)
Sigma2 = ((sigmaA**2, 0), (0, sigmaB**2))

La solución de minimizar la distancia:

Dist(Mu, Sigma2, Z)

sujeta al sistema de ecuaciones:

B·Z == C

viene dad por:

Z = Sigma2·B' · (B·Sigma2·B')**-1 · (C-B·Mu) + Mu

En nuestro ejemplo, las matrices B y C son:

B = (1, -1)
C = (0)

de modo que la solución encontrada es:

zA = muA + sigmaA**2 * (muB-muA) / (sigmaA**2+sigmaB**2)
zB = muB - sigmaB**2 * (muB-muA) / (sigmaA**2+sigmaB**2)

y simplificando:

z = zA = zB = (muA * sigmaB**2 + muB * sigmaA**2) / (sigmaA**2 + sigmaB**2)

Nótese que este resultado puede verse como una media ponderada con las inversas de las varianzas de los valores muA y muB:

z = (muA * sigmaA**-2 + muB * sigmaB**-2) / (sigmaA**-2 + sigmaB**-2)

Solución como variables aleatorias

Planteamos ahora la solución a la combinación desde un punto de vista estadístico.

Dada que la combinación es una igualdad entre dos variables aleatorias, la solución encontrada para una será también la de la otra y la correlación entre ellas será 1.

La distribución a posteriori para la variable A viene dada por dos contribuciones: una debida a su información a priori (vA) y otra causada por el sistema de ecuaciones y el resto de información a priori.

En este caso sencillo podríamos escribir la función de densidad a posteriori de la variable A (fwA) proporcional al producto de su función de densidad a priori (fvA) y la función de densidad a priori obtenida mediante la ecuación (wA==wB) que no es otra que la función de densidad a priori de la varible B (fvB):

fwA(x) = k * fvA(x) * fvB(x) = k * fNormal(muA, sigmaA, x) * fNormal(muB, sigmaB, x)

Se puede comprobar que esta función de densidad es la de una distribución normal:

wA ~ N(muAB, sigmaAB)

con los siguientes parámetros:

muAB = (muA * sigmaB**2 + muB * sigmaA**2) / (sigmaA**2 + sigmaB**2)
sigmaAB = sigmaA * sigmaB / Sqrt(sigmaA**2 + sigmaB**2)

De modo que la solución a la combinación será:

w = wA = wB ~ N(muAB, sigmaAB)

En modo matricial podemos representarlo como:

Mu_W' = (muAB, muAB)
Sigma2_W = ((sigmaAB, sigmaAB), (sigmaAB, sigmaAB))

Nótese que esta solución nos ofrece como valores medios y también como valores más probables (modas) la solución obtenida minimizando la distancia de Mahalanobis.

Combinación de variables con una sóla ecuación

Otro ejercicio bastante sencillo que podemos imaginar es aquel formado por un conjunto de variables aleatorias (de tipo real) que siguen distribuciones normales (e independientes) sujetas a una restricción formada por una sola ecuación.

Caso de tres variables

Por sencillez trataremos detalladamente el caso de tres variables:

Dadas vA, vB y vC (variables a priori):

vA ~ N(muA, sigmaA)
vB ~ N(muB, sigmaB)
vC ~ N(muC, sigmaC)

encontrar las wA, wB y wC (variables a posteriori) que satisfagan:

a*wA + b*wB + c*wC == d

Solución determinista

De acuerdo al método utilizado para encontrar la solución determinista (no como variables aleatorias) del sistema reduciendo la distacia de Mahalanobis de la solución Z al punto de partida Mu:

Z = Sigma2·B' · (B·Sigma2·B')**-1 · (C-B·Mu) + Mu

donde:

Z' = (zA, zB, zC)
Mu' = (muA, muB, muC)
Sigma2 = ((sigmaA**2, 0, 0), (0, sigmaB**2, 0), (0, 0, sigmaC**2))

y utilizando la restricción:

B = ((a, b, c))
C = ((d))

encontramos:

    { zA = muA + a * sigmaA**2 * (d - a*muA - b*muB - c*muC) / (a*sigmaA**2 + b*sigmaB**2 + c*sigmaC**2)
Z = { zB = muB + b * sigmaB**2 * (d - a*muA - b*muB - c*muC) / (a*sigmaA**2 + b*sigmaB**2 + c*sigmaC**2)
    { zC = muC + c * sigmaC**2 * (d - a*muA - b*muB - c*muC) / (a*sigmaA**2 + b*sigmaB**2 + c*sigmaC**2)

Solución como variables aleatorias

Como hicimos antes ahora planteamos la solución a la combinación desde un punto de vista estadístico.

Dada la simetría de la combinación, la solución para una de las variables nos valdrá para las demás, modificándola convenientemente.

Mientras que en el ejemplo anterior la restricción formaba un espacio con un grado de libertad, en el ejemplo que nos ocupa el espacio tiene dos grados de libertad, de modo que para un valor de la variable A encontramos toda una recta de valores de las variables B y C compatibles.

Así pues podemos escribir la función de densidad a posteriori de la variable A (fwA) proporcional al producto de su función de densidad a priori (fvA) y la función de densidad a priori obtenida mediante la ecuación (a*wA+b*wB+c*wC==d) que podemos escribir como:

fvBC(x) = Integrate(fNormal(muB, sigmaB, y) * fNormal(muB, sigmaB, (d-a*x-b*y)/c), {y, -infinite, infinite})

de modo que:

fwA(x) = k * fvA(x) * fvBC(x) = k * fNormal(muA, sigmaA, x) * fvBC(x)

Se puede comprobar que esta función de densidad es la de una distribución normal:

wA ~ N(muA_BC, sigmaA_BC)

con los siguientes parámetros:

muA_BC = (a * (d - b*muB - c*muC) * sigmaA**2 + muA * ((b*sigmaB)**2 + (c*sigmaC)**2))  / ((a*sigmaA)**2 + (b*sigmaB)**2 + (c*sigmaC)**2)
sigmaA_BC = sigmaA * Sqrt((b*sigmaB)**2 + (c*sigmaC)**2) / Sqrt((a*sigmaA)**2 + (b*sigmaB)**2 + (c*sigmaC)**2)

Se puede comprobar que esta solución es coherente con el resultado del ejemplo anterior. Usando los valores: a=1, b=-1, c=0 y d=0 se obtiene:

muA_BC = (- muB * sigmaA**2 + muA * sigmaB**2) / (sigmaA**2 + sigmaB**2)
sigmaA_BC = sigmaA * sigmaB / Sqrt(sigmaA**2 + sigmaB**2)

Utilizando la simetría de la combinación podemos obtener las restantes variables como:

wA ~ N(muA_post, sigmaA_post)
wB ~ N(muB_post, sigmaB_post)
wC ~ N(muC_post, sigmaC_post)

cuyos parámetros se pueden escribir como:

muX_post = (x * (Dm + x*muX) * sigmaX**2 + muX * (S2 - (X*sigmaX)**2))  / (S2)
sigmaX_post = sigmaX * Sqrt(S2 - (x*sigmaX)**2) / Sqrt(S2)

donde:

S2 := (a*sigmaA)**2 + (b*sigmaB)**2 + (c*sigmaC)**2
Dm := d-a*muA-b*muB-c*muC

sustituyendo 'x' y 'X' por 'a', 'b' o 'c' y 'A', 'B' o 'C' respectivamente.

Attachments (2)

combination3D.png (15.9 KB) - added by Pedro Gea 16 years ago.
combination2D.png (16.1 KB) - added by Pedro Gea 16 years ago.

Download all attachments as: .zip

Download in other formats:

Plain Text