wiki:Combinations
close Warning: Can't synchronize with repository "(default)" (/var/svn/mms does not appear to be a Subversion repository.). Look in the Trac log for more information.

Version 26 (modified by Pedro Gea, 14 years ago) (diff)

--

Combinaciones de variables aleatorias

Introducción

Uno de los principales objetivos de la modelación es la obtención de previsiones para las variables modeladas. Estas previsiones se presentan como variables aleatorias que ofrecen una cierta distribución de probabilidad sobre los posibles valores futuros de las variables. En ocasiones disponemos de previsiones sobre un conjunto de variables que no son independientes entres sí, teniéndose que verificar una cierta relación entre ellas. Al ejercicio de encontrar un nuevo conjunto de previsiones sujeto a esta relación y basado en las previsiones originales se le conoce como combinación de previsiones.

Uno de los ejemplos más comunes de combinación de previsiones es el planteado por un conjunto de variables donde una de ellas es suma de las demás. Otras situaciones que se pueden plantear como una combinación de previsiones son cuando disponemos de previsiones para una misma variable en distintos fechados armónicos entre sí, o cuando se quiere introducir información a priori sobre las previsiones.

Este problema matemático no está limitado a previsiones, sino que puede definirse sobre variables aleatorias en general. De modo que lo denominaremos combinación de variables aleatorias dejando el término combinación de previsiones para referirnos al ejercicio de modelación concreto en el que usamos previsiones.

Definición

Sea un conjunto de variables aleatorias V={v_i} cuya distribución de probabilidad es conocida y F(V) = 0 un conjunto de restricciones sobre ellas, denominamos combinación de variables aleatorias al problema de encontrar la distribución de probabilidad de dichas variables sujeta al conjunto de restricciones.


Gráfico: Representación gráfica de la combinación de variables aleatorias.
En el gráfico de la izquierda se representa un problema de combinación de tres variables aleatorias normales e independientes (representadas por los puntos) con una restricción formada por una sola ecuación lineal (representada por el plano).
En el gráfico de la derecha se representa un ejemplo similar al anterior pero para dos variables aleatorias. En rojo se representan las funciones de densidad de cada una de las variables aleatorias, previas a la combinación, siendo los puntos, una muestra de ella. La línea en verde representa el espacio al que se restringen las variables aleatorias con la combinación. El punto en verde representa a la media de la solución de la combinación conocida también en el documento como solución determinista. En azul se representan las funciones de densidad de cada una de las variables aleatorias tras la combinación.

Generalización

El problema de la combinación de variables aleatorias se puede generalizar introduciendo restricciones de dominio sobre las variables de modo que la combinación se puede describir como un conjunto de variables aleatorias cuya distribución a priori es conocida, sujetas a un conjunto de restricciones de igualdad y de dominio.

Solución de la combinación

Uno de los ejercicios más habituales por su sencillez es encontrar simplemente un valor determinista (un estadístico) para la combinación de variables. El estadístico buscado podría ser la media, el valor más probable (la moda) o incluso la mediana, aunque en el caso de variables aleatorias normales estos tres coinciden.

Para un conjunto de variables normales la solución determinista buscada es aquélla que minimiza distancia de Mahalanobis) a las medias de las distribuciones a priori de las variables aleatorias.

Formalmente la solución sería un conjunto de variables aleatorias restringidas al espacio de soluciones y cuya distribución de probabilidad está condicionada a las distribuciones de partida o a priori.

Merece la pena mencionar que la solución determinista encontrada al minimizar la distancia de Mahalanobis para un conjunto de variables aleatorias normales coincide con las medias de las distribuciones a posteriori de estas variables aleatorias.

Combinación lineal de variables aleatorias

Un caso particular y especialmente común de la combinación de variables aleatorias es aquél en el que la restricción viene dada por un sistema de ecuaciones lineales. Este sistema de ecuaciones lineales habitualmente es compatible indeterminado, dando lugar a un espacio de soluciones con varios grados de libertad.

Sea V un conjunto de n variables aleatorias distribuidas como una normal multivariada:

V ~ Normal(Mu, Sigma)

donde Mu (nx1) es el vector de medias y Sigma (nxn) su matriz de covarianza, y

B · V = C

un sistema de m restricciones lineales sobre las variables, donde B (mxn) es la matriz del sistema lineal y C (mx1) es su término constante.

La solución W de una combinación lineal de variables aleatorias normales es un nuevo conjunto de variables aleatorias normales:

W ~ Normal(Nu, Omega)

cuya media Nu viene dada por:

Nu = Mu + Sigma·B'·Inv(B·Sigma·B')·(C-B·Mu)

y cuya matriz de covarianza Omega puede obtenerse mediante:

Omega = (I-Sigma·B'·Inv(B·Sigma·B')·B) · Sigma · (I-Sigma·B'·Inv(B·Sigma·B')·B)'

Para ver una deducción de estos resultados véase el documento completo sobre la combinación lineal de variables aleatorias normales.

Ejercicios

A continuación planteamos algunos ejercicios de combinaciones muy sencillos que pueden sernos útil para aclarar conceptos y para encontrar algunos resultados que pueden extenderse a combinaciones más complejas.

Otros temas

Temas para su desarrollo

Este documentación puede ampliarse con otros puntos de gran interés en la combinación de variables aleatorias como:

  • La resolución de las combinaciones lineales cuando la matriz de restricciones no tiene rango completo: uso de la pseudoinversa.
  • La deducción de la matriz de covarianzas en el caso de las combinaciones lineales de variables trans-normales e interpretación de la solución determinista.
  • El caso particular de las combinaciones de variables aleatorias que presentan estructura ARIMA.
  • Descripción de las funciones implentadas en SADD en los términos expuestos.
  • Las combinaciones de variables aleatorias de tipo serie temporal. Combinaciones en distintos fechados.
  • Las combinaciones de variables aleatorias con una distribución no relacionada con la distribución normal.
  • Las combinaciones de variables en caso de restricciones especiales: restricción sobre dominios cerrados, etc.
  • Las combinaciones de variables para las que se conoce una muestra. Solución utilizando sus estadísticos bajo la hipótesis de normalidad. Nuevos métodos de resolución.
  • Las combinaciones generalizadas con restricciones de dominio.

Attachments (2)

Download all attachments as: .zip