El módulo de modelos
A continuación presentamos una introducción a los conceptos implementados en MMS en torno al módulo de modelos. El documento no pretende ser exhaustivo ni en el desarrollo de los conceptos matemáticos utilizados (véase la documentación técnica correspondiente), ni en la descripción de su implementación en MMS, sino que pretende de la manera más sencilla posible introducir al usuario en los principales conceptos utilizados en MMS que le permitan tener una visión global de cómo está estructurado el módulo de modelos.
El modelo
Los modelos que sirven como punto de partida en el desarrollo de MMS son los modelos lineales o de regresión ampliados con ciertas no-linealidades para tratar problemas más complejos. Estos modelos extendidos admiten entre otras características, una transformación previa del output, términos explicativos que proceden de un filtro no lineal, estructura de covarianzas en el ruido e incluso nuevas regresiones sobre sus parámetros.
El concepto de modelo implementado en MMS hace referencia al modelo jerárquico formado por uno o varios modelos lineales sobre las observaciones junto a algún modelo lineal sobre sus parámetros.
Cada uno de los modelos de observaciones que forman parte del modelo jerárquico es conocido como submodelo, mientras que los modelos de parámetros se denominan jerarquías en alusión a la jerarquía de parámetros a la que dan lugar.
Gráfico: Subdiagrama del modelo como objeto principal del módulo de modelos. El diagrama puede leerse como sigue:
- Un modelo puede tener uno o varios submodelos
- Un modelo puede tener varias jerarquías Un submodelo tiene un ruido
El submodelo
El concepto de submodelo en MMS corresponde con el concepto más común de modelo y se refiere a cada uno de los modelos de observaciones que forman parte de una entidad mayor formada por varios submodelos que es el modelo (el modelo jerárquico).
El submodelo o modelo de observaciones (para distinguirlo del modelo jerárquico o de los modelos de parámetros o jerarquías) es esencialmente un modelo lineal formado por una variable explicada o output, descrita como una suma de términos explicativos más un ruido, error o término no explicado.
Gráfico: Subdiagrama del submodelo o modelo de observaciones. El diagrama puede leerse como sigue:
- Un submodelo tiene una variable de modelo (su output)
- Un submodelo puede tener varios términos explicativos y éstos tienen una o varias variables de modelo (sus inputs)
- Un submodelo tiene un ruido
De manera general podríamos expresar la ecuación de un submodelo como:
donde es el output, son los términos explicativos y es el ruido.
El output
El output del modelo es la variable explicada u observaciones que se está modelando.
No todas las variables pueden ser descritas con un modelo aditivo, pero en ocasiones basta una transformación de las observaciones para encontrar un output adecuado. Por ello en MMS las variables de los modelos admiten una transformación que permita describirlas mediante un modelo lineal.
Con la aparición de la transformación aparece una cierta ambigüedad en el concepto de output, ya que hay dos variables, la variable original sin transformar y la variable transformada. En MMS adoptamos el criterio de llamar observaciones a la primera y output a la segunda, de modo que el output continua siendo el término explicado (situado a la izquierda de la ecuación):
donde continua siendo el output, es la transformación y son las observaciones.
Los términos explicativos
El output en un modelo lineal es explicado como una suma de términos que denominamos términos explicativos. Los términos explicativos tienen la forma de un producto de un coeficiente, el parámetro, por una variable comúnmente denominada variable explicativa o input. El término explicativo se puede expresar como:
donde es el término explicativo -ésimo, su parámetro y su input.
Los términos explicativos se pueden generalizar y así introducir relaciones no lineales como una función de varias variables explicativas y varios parámetros, que en general podemos denominar no-lineales:
donde representa al conjunto de variables explicativas o inputs y al conjunto de parámetros no-lineales. Al factor que sustituye al input lo denominamos filtro del término explicativo.
El ruido
En un modelo lineal el término que recoge la parte no explicada del output se conoce como error, ruido o perturbación. Comúnmente este término admite las hipótesis de normalidad con media cero, varianza constante e independencia de las perturbaciones:
es decir:
donde es el parámetro de la varianza de las perturbaciones.
Los modelos lineales descritos se pueden extender si consideramos que el ruido tiene la estructura de un proceso ARIMA:
donde y son los parámetros de ruido ARIMA y sus residuos que ahora representan a las perturbaciones que admiten la hipótesis de normalidad anterior:
La jerarquía
Un modelo jerárquico se caracteriza por la posibilidad de expresar nuevas relaciones lineales entre sus parámetros, de modo que un parámetro o un conjunto de parámetro pueda describirse como una regresión con nuevos parámetros, conocidos como hiperparámetros.
En MMS, estos nuevos modelos lineales sobre los parámetros de los submodelos se conocen como modelos de parámetros o jerarquías. De manera análoga a los submodelos una jerarquía está formada por un conjunto de parámetros explicados -el output-, un conjunto de términos explicativos y un ruido o parte no explicada.
Gráfico: Subdiagrama de la jerarquía o modelo sobre los parámetros. El diagrama puede leerse como sigue:
- Una jerarquía explica uno o varios elementos del modelo (su output)
- Una jerarquía tiene uno varios términos de jerarquía
- Una jerarquía tiene un ruido
Una jerarquía puede expresarse en forma de ecuación como:
donde representa al conjunto de parámetros explicados o output de la jerarquía, a cada uno de los términos explicativos de la jerarquía y al ruido.
Output de la jerarquía
El output de la jerarquía es el conjunto o la selección de parámetros que va a expresarse como una regresión de los nuevos parámetros:
Este conjunto de parámetros no está limitado a los parámetros de los submodelos sino que puede estar formado por cualquier parámetro de un submodelo o de una jerarquía ya definida.
Aún más, el output de una jerarquía puede estar formado por combinaciones lineales de parámetros, de modo que un elemento del output puede ser (i) un parámetro de un submodelo, (ii) un parámetro de una jerarquía o (iii) una combinación lineal de parámetros.
De manera general podemos expresar cada elemento del output como:
donde es el elemento -ésimo del output y son los coeficientes de la combinación lineal de parámetros .
Términos de la jerarquía
El output de la jerarquía, como en otro modelo lineal, es explicado como una suma de términos que aquí denominamos términos de la jerarquía. Éstos tienen la forma de un producto de un coeficiente, el hiperparámetro, por un conjunto de coeficientes que hacen las veces de inputs de la jerarquía y que dan significado a los hiperparámetros. El término de una jerarquía se puede expresar como:
donde es el término -ésimo, su hiperparámetro y el “hiperinput” que expresa las posibles relaciones lineales entre los parámetros explicados en la jerarquía.
Ruido
El término de ruido o perturbaciones de una jerarquía es similar al de un submodelo y comúnmente admite las hipótesis de normalidad con media cero, varianza constante e independencia:
donde es el parámetro de la varianza de las perturbaciones.
Este término puede extenderse eliminando la hipótesis de varianza constante e independencia entre las perturbaciones e introduciendo en general una matriz de covarianza de forma que:
donde es la matriz de covarianza.
Información a priori
El modelo en MMS dispone de la posibilidad de añadir información a priori sobre los parámetros o sobre combinaciones lineales de ellos. Esta información a priori puede ser de dos tipos: una distribución de probabilidad normal a priori y una restricción de dominio. Éstas pueden expresarse como:
donde es un parámetro o combinación de parámetros cualquiera del modelo, y son los parámetros de su distribución normal a priori, y y los extremos de su intervalo de dominio.
Gráfico: Subdiagrama del módulo de modelos que representa la incorporación de la información a priori sobre los elementos de los modelos.
Resumen
Hemos visto que el modelo en MMS puede estar compuesto por uno o varios submodelos y varias jerarquías y que puede presentar información a priori sobre sus parámetros o combinaciones de ellos.
Mediante estas relaciones el modelo explica una o más variables (los outputs) a través de otro conjunto de variables (los inputs) y un conjunto de parámetros: parámetros lineales y no lineales, parámetros de ARIMA, hiperparámetros, etc.
Los modelos en MMS no se limitan a esto y pueden extenderse aún más con la presencia de nuevas características como:
- Una función de enlace en los modelos de observaciones (o submodelos) que permite extenderlos a la familia de los modelos lineales generalizados.
- La presencia de valores desconocidos en las variables del modelo (outputs e inputs) dando lugar a parámetros extra denominados parámetros de omitido.
- La definición de equivalencias entre parámetros que permiten el tratamiento de parámetros internodales, es decir parámetros que participan en más de un submodelo o jerarquía.
Para conocer más detalles sobre los modelos en MMS o el uso de estas nuevas características véase la documentación específica sobre los distintos tipos de modelos en MMS.
A continuación presentamos en un diagrama la estructura completa del modelo, unificando y completando los subdiagramas presentados anteriormente. No pretende ser un diagrama exhaustivo de las clases del módulo de modelos sino un diagrama para la comprensión de su diseño mediante una selección de las clases más significativas.
Gráfico: Diagrama del modelo como objeto principal del módulo de modelos. El diagrama se puede leer como sigue:
- Desde el modelo
- El modelo es la unidad principal del módulo de modelos
- El modelo se complementa con un dataset
- Un modelo puede tener uno o varios submodelos
- Un modelo puede tener varias jerarquías
- Un modelo contiene una o varias variables de modelo
- Desde el submodelo
- Un submodelo tiene una variable de modelo (su output)
- Un submodelo puede tener varios términos explicativos
- Un submodelo tiene un ruido
- Desde la jerarquía
- Una jerarquía explica uno o varios elementos (su output)
- Una jerarquía tiene uno varios términos de jerarquía
- Una jerarquía tiene un ruido
- Desde la variable del modelo o m-variable
- Una m-variable hace referencia a una variable del dataset del modelo
- Una m-variable puede tener parámetros de omitido
- Desde el término explicativo
- Un término explicativo tiene una o varias m-variables (sus inputs)
- Un término explicativo puede tener parámetros lineales y no-lineales
- Desde el ruido
- Un ruido puede tener parámetros de sigma2 y ARIMA
- Desde el término de la jerarquía
- Un término de la jerarquía tiene un hiperparámetro
- Desde el elemento del modelo
- Un parámetro, una combinación y una equivalencia son elementos del modelo
- Un elemento del modelo puede tener un prior
- Un elemento del modelo puede tener una restricción
- Desde la combinación de parámetros
- Una combinación tiene varios parámetros
- Desde la equivalencia de parámetros
- Una equivalencia tiene varios parámetros