wiki:IntroModels

Context Navigation

close Warning: Can't synchronize with repository "(default)" (/var/svn/mms does not appear to be a Subversion repository.). Look in the Trac log for more information.

El módulo de modelos

A continuación presentamos una introducción a los conceptos implementados en MMS en torno al módulo de modelos. El documento no pretende ser exhaustivo ni en el desarrollo de los conceptos matemáticos utilizados (véase la documentación técnica correspondiente), ni en la descripción de su implementación en MMS, sino que pretende de la manera más sencilla posible introducir al usuario en los principales conceptos utilizados en MMS que le permitan tener una visión global de cómo está estructurado el módulo de modelos.

El modelo

Los modelos que sirven como punto de partida en el desarrollo de MMS son los modelos lineales o de regresión ampliados con ciertas no-linealidades para tratar problemas más complejos. Estos modelos extendidos admiten entre otras características, una transformación previa del output, términos explicativos que proceden de un filtro no lineal, estructura de covarianzas en el ruido e incluso nuevas regresiones sobre sus parámetros.

El concepto de modelo implementado en MMS hace referencia al modelo jerárquico formado por uno o varios modelos lineales sobre las observaciones junto a algún modelo lineal sobre sus parámetros.

Cada uno de los modelos de observaciones que forman parte del modelo jerárquico es conocido como submodelo, mientras que los modelos de parámetros se denominan jerarquías en alusión a la jerarquía de parámetros a la que dan lugar.

Gráfico: Subdiagrama del modelo como objeto principal del módulo de modelos. El diagrama puede leerse como sigue:

Un modelo puede tener uno o varios submodelos
Un modelo puede tener varias jerarquías Un submodelo tiene un ruido

El submodelo

El concepto de submodelo en MMS corresponde con el concepto más común de modelo y se refiere a cada uno de los modelos de observaciones que forman parte de una entidad mayor formada por varios submodelos que es el modelo (el modelo jerárquico).

El submodelo o modelo de observaciones (para distinguirlo del modelo jerárquico o de los modelos de parámetros o jerarquías) es esencialmente un modelo lineal formado por una variable explicada o output, descrita como una suma de términos explicativos más un ruido, error o término no explicado.

Gráfico: Subdiagrama del submodelo o modelo de observaciones. El diagrama puede leerse como sigue:

Un submodelo tiene una variable de modelo (su output)
Un submodelo puede tener varios términos explicativos y éstos tienen una o varias variables de modelo (sus inputs)
Un submodelo tiene un ruido

De manera general podríamos expresar la ecuación de un submodelo como:

$Y=\sum_{i}{\beta_i X_i} +N$

donde $Y$ es el output, $E_i = \beta_i X_i$ son los términos explicativos y $N$ es el ruido.

El output

El output del modelo es la variable explicada u observaciones que se está modelando.

No todas las variables pueden ser descritas con un modelo aditivo, pero en ocasiones basta una transformación de las observaciones para encontrar un output adecuado. Por ello en MMS las variables de los modelos admiten una transformación que permita describirlas mediante un modelo lineal.

Con la aparición de la transformación aparece una cierta ambigüedad en el concepto de output, ya que hay dos variables, la variable original sin transformar y la variable transformada. En MMS adoptamos el criterio de llamar observaciones a la primera y output a la segunda, de modo que el output continua siendo el término explicado (situado a la izquierda de la ecuación):

$Y = T(V)$

donde $Y$ continua siendo el output, $T$ es la transformación y $V$ son las observaciones.

Los términos explicativos

El output en un modelo lineal es explicado como una suma de términos que denominamos términos explicativos. Los términos explicativos tienen la forma de un producto de un coeficiente, el parámetro, por una variable comúnmente denominada variable explicativa o input. El término explicativo se puede expresar como:

$E_i = \beta_i X_i$

donde $E_i$ es el término explicativo $i$ -ésimo, $\beta_i$ su parámetro y $X_i$ su input.

Los términos explicativos se pueden generalizar y así introducir relaciones no lineales como una función de varias variables explicativas y varios parámetros, que en general podemos denominar no-lineales:

$E_i = \beta_i f_i(U_j; \delta_k)$

donde $U_j$ representa al conjunto de variables explicativas o inputs y $\delta_k$ al conjunto de parámetros no-lineales. Al factor $f_i(U_j; \delta_k)$ que sustituye al input $X_i$ lo denominamos filtro del término explicativo.

El ruido

En un modelo lineal el término que recoge la parte no explicada del output se conoce como error, ruido o perturbación. Comúnmente este término admite las hipótesis de normalidad con media cero, varianza constante e independencia de las perturbaciones:

$\begin{align} & E[N_i] = 0 \\ & Var(N_i) = \sigma^2 \\ & E[N_i N_{(j \neq i)}] = 0 \end{align}$

es decir:

$N \sim Normal(0, \sigma^2 I)$

donde $\sigma^2$ es el parámetro de la varianza de las perturbaciones.

Los modelos lineales descritos se pueden extender si consideramos que el ruido tiene la estructura de un proceso ARIMA:

$N \sim ARIMA(R; \phi_i, \theta_j)$

donde $\phi_i$ y $\theta_j$ son los parámetros de ruido ARIMA y $R$ sus residuos que ahora representan a las perturbaciones que admiten la hipótesis de normalidad anterior:

$R \sim Normal(0, \sigma^2 I)$

La jerarquía

Un modelo jerárquico se caracteriza por la posibilidad de expresar nuevas relaciones lineales entre sus parámetros, de modo que un parámetro o un conjunto de parámetro pueda describirse como una regresión con nuevos parámetros, conocidos como hiperparámetros.

En MMS, estos nuevos modelos lineales sobre los parámetros de los submodelos se conocen como modelos de parámetros o jerarquías. De manera análoga a los submodelos una jerarquía está formada por un conjunto de parámetros explicados -el output-, un conjunto de términos explicativos y un ruido o parte no explicada.

Gráfico: Subdiagrama de la jerarquía o modelo sobre los parámetros. El diagrama puede leerse como sigue:

Una jerarquía explica uno o varios elementos del modelo (su output)
Una jerarquía tiene uno varios términos de jerarquía
Una jerarquía tiene un ruido

Una jerarquía puede expresarse en forma de ecuación como:

$\zeta = \sum_i{\gamma_i Z_i} + N$

donde $\zeta$ representa al conjunto de parámetros explicados o output de la jerarquía, $H_i = \gamma_i Z_i$ a cada uno de los términos explicativos de la jerarquía y $N$ al ruido.

Output de la jerarquía

El output de la jerarquía es el conjunto o la selección de parámetros que va a expresarse como una regresión de los nuevos parámetros:

$\zeta = {\beta_h}$

Este conjunto de parámetros ${\beta_h}$ no está limitado a los parámetros de los submodelos sino que puede estar formado por cualquier parámetro de un submodelo o de una jerarquía ya definida.

Aún más, el output de una jerarquía puede estar formado por combinaciones lineales de parámetros, de modo que un elemento del output puede ser (i) un parámetro de un submodelo, (ii) un parámetro de una jerarquía o (iii) una combinación lineal de parámetros.

De manera general podemos expresar cada elemento del output como:

$\zeta_h = \sum_{i \in C_h}{\alpha_{h,i} \beta_i}$

donde $\zeta_h$ es el elemento $h$ -ésimo del output y $\alpha_{h,i}$ son los coeficientes de la combinación lineal $C_h$ de parámetros $\beta_i$ .

Términos de la jerarquía

El output de la jerarquía, como en otro modelo lineal, es explicado como una suma de términos que aquí denominamos términos de la jerarquía. Éstos tienen la forma de un producto de un coeficiente, el hiperparámetro, por un conjunto de coeficientes que hacen las veces de inputs de la jerarquía y que dan significado a los hiperparámetros. El término de una jerarquía se puede expresar como:

$H_i = \gamma_i Z_i$

donde $H_i$ es el término $i$ -ésimo, $\gamma_i$ su hiperparámetro y $Z_i$ el “hiperinput” que expresa las posibles relaciones lineales entre los parámetros explicados en la jerarquía.

Ruido

El término de ruido o perturbaciones de una jerarquía es similar al de un submodelo y comúnmente admite las hipótesis de normalidad con media cero, varianza constante e independencia:

$N \sim Normal(0, \sigma^2 I)$

donde $\sigma^2$ es el parámetro de la varianza de las perturbaciones.

Este término puede extenderse eliminando la hipótesis de varianza constante e independencia entre las perturbaciones e introduciendo en general una matriz de covarianza de forma que:

$N \sim Normal(0, \sigma^2\Sigma_0)$

donde $\sigma^2\Sigma_0$ es la matriz de covarianza.

Información a priori

El modelo en MMS dispone de la posibilidad de añadir información a priori sobre los parámetros o sobre combinaciones lineales de ellos. Esta información a priori puede ser de dos tipos: una distribución de probabilidad normal a priori y una restricción de dominio. Éstas pueden expresarse como:

$\zeta_h^{(0)} \sim Normal(\mu_h, \sigma_h^2)$

$\zeta_{h,min} < \zeta_h < \zeta_{h,max}$

donde $\zeta_h$ es un parámetro o combinación de parámetros cualquiera del modelo, $\mu_h$ y $\sigma_h^2$ son los parámetros de su distribución normal a priori, y $\zeta_{h,min}$ y $\zeta_{h,max}$ los extremos de su intervalo de dominio.

Gráfico: Subdiagrama del módulo de modelos que representa la incorporación de la información a priori sobre los elementos de los modelos.

Resumen

Hemos visto que el modelo en MMS puede estar compuesto por uno o varios submodelos y varias jerarquías y que puede presentar información a priori sobre sus parámetros o combinaciones de ellos.

Mediante estas relaciones el modelo explica una o más variables (los outputs) a través de otro conjunto de variables (los inputs) y un conjunto de parámetros: parámetros lineales y no lineales, parámetros de ARIMA, hiperparámetros, etc.

Los modelos en MMS no se limitan a esto y pueden extenderse aún más con la presencia de nuevas características como:

Una función de enlace en los modelos de observaciones (o submodelos) que permite extenderlos a la familia de los modelos lineales generalizados.
La presencia de valores desconocidos en las variables del modelo (outputs e inputs) dando lugar a parámetros extra denominados parámetros de omitido.
La definición de equivalencias entre parámetros que permiten el tratamiento de parámetros internodales, es decir parámetros que participan en más de un submodelo o jerarquía.

Para conocer más detalles sobre los modelos en MMS o el uso de estas nuevas características véase la documentación específica sobre los distintos tipos de modelos en MMS.

A continuación presentamos en un diagrama la estructura completa del modelo, unificando y completando los subdiagramas presentados anteriormente. No pretende ser un diagrama exhaustivo de las clases del módulo de modelos sino un diagrama para la comprensión de su diseño mediante una selección de las clases más significativas.

Gráfico: Diagrama del modelo como objeto principal del módulo de modelos. El diagrama se puede leer como sigue:

Desde el modelo
- El modelo es la unidad principal del módulo de modelos
- El modelo se complementa con un dataset
- Un modelo puede tener uno o varios submodelos
- Un modelo puede tener varias jerarquías
- Un modelo contiene una o varias variables de modelo
Desde el submodelo
- Un submodelo tiene una variable de modelo (su output)
- Un submodelo puede tener varios términos explicativos
- Un submodelo tiene un ruido
Desde la jerarquía
- Una jerarquía explica uno o varios elementos (su output)
- Una jerarquía tiene uno varios términos de jerarquía
- Una jerarquía tiene un ruido
Desde la variable del modelo o m-variable
- Una m-variable hace referencia a una variable del dataset del modelo
- Una m-variable puede tener parámetros de omitido
Desde el término explicativo
- Un término explicativo tiene una o varias m-variables (sus inputs)
- Un término explicativo puede tener parámetros lineales y no-lineales
Desde el ruido
- Un ruido puede tener parámetros de sigma2 y ARIMA
Desde el término de la jerarquía
- Un término de la jerarquía tiene un hiperparámetro
Desde el elemento del modelo
- Un parámetro, una combinación y una equivalencia son elementos del modelo
- Un elemento del modelo puede tener un prior
- Un elemento del modelo puede tener una restricción
Desde la combinación de parámetros
- Una combinación tiene varios parámetros
Desde la equivalencia de parámetros
- Una equivalencia tiene varios parámetros

Last modified 15 years ago Last modified on Oct 7, 2010, 2:54:49 PM

Download in other formats:

Plain Text