| 1 | = Modelos = |
| 2 | |
| 3 | A continuación presentamos una introducción a los conceptos implementados en MMS en torno al módulo de modelos. El documento no pretende ser exhaustivo ni en el desarrollo de los conceptos matemáticos utilizados (véase la documentación técnica correspondiente), ni en la descripción de su implementación en MMS, sino que pretende de la manera más sencilla posible introducir al usuario en los principales conceptos utilizados en MMS que le permitan tener una visión global de cómo está estructurado el módulo de modelos. |
| 4 | |
| 5 | == El modelo == |
| 6 | |
| 7 | Los modelos que sirven como punto de partida en el desarrollo de MMS son los modelos lineales o de regresión ampliados con ciertas no-linealidades para tratar problemas más complejos. Estos modelos extendidos admiten entre otras características, una transformación previa del output, términos explicativos que proceden de un filtro no lineal, estructura de covarianzas en el ruido e incluso nuevas regresiones sobre sus parámetros. |
| 8 | |
| 9 | El concepto de modelo implementado en MMS hace referencia al modelo jerárquico formado por uno o varios modelos lineales sobre las observaciones junto a algún modelo lineal sobre sus parámetros. |
| 10 | |
| 11 | Cada uno de los modelos de observaciones que forman parte del modelo jerárquico es conocido como submodelo, mientras que los modelos de parámetros se denominan jerarquías en alusión a la jerarquía de parámetros a la que dan lugar. |
| 12 | |
| 13 | * Modelo |
| 14 | * Submodelos |
| 15 | * Jerarquías |
| 16 | |
| 17 | == El submodelo == |
| 18 | |
| 19 | El concepto de submodelo en MMS corresponde con el concepto más común de modelo y se refiere a cada uno de los modelos de observaciones que forman parte de una entidad mayor formada por varios submodelos que es el modelo (el modelo jerárquico). |
| 20 | |
| 21 | El submodelo o modelo de observaciones (para distinguirlo del modelo jerárquico o de los modelos de parámetros o jerarquías) es esencialmente un modelo lineal formado por una variable explicada o output, descrita como una suma de términos explicativos más un ruido, error o término no explicado. |
| 22 | |
| 23 | * Submodelo |
| 24 | * Output |
| 25 | * Términos explicativos |
| 26 | * Ruido |
| 27 | |
| 28 | De manera general podríamos expresar la ecuación de un submodelo como: |
| 29 | {{{ |
| 30 | //#!latex |
| 31 | Y=\sum_{i}{\beta_i X_i} +N |
| 32 | }}} |
| 33 | |
| 34 | {{{ |
| 35 | Y = Sum_i(β_i X_i) + N |
| 36 | }}} |
| 37 | donde {{{Y}}} es el output, {{{E_i = β_i X_i}}} son los términos explicativos y {{{N}}} es el ruido. |
| 38 | |
| 39 | === El output === |
| 40 | |
| 41 | El output del modelo es la variable explicada u observaciones que se está modelando. |
| 42 | |
| 43 | No todas las variables pueden ser descritas con un modelo aditivo, pero en ocasiones basta una transformación de las observaciones para encontrar un output adecuado. Por ello en MMS las variables de los modelos admiten una transformación que permita describirlas mediante un modelo lineal. |
| 44 | |
| 45 | Con la aparición de la transformación aparece una cierta ambigüedad en el concepto de output, ya que hay dos variables, la variable original sin transformar y la variable transformada. En MMS adoptamos el criterio de llamar observaciones a la primera y output a la segunda, de modo que el output continua siendo el término explicado (situado a la izquierda de la ecuación): |
| 46 | {{{ |
| 47 | Y = T(V) |
| 48 | }}} |
| 49 | donde {{{Y}}} continua siendo el output, {{{T}}} es la transformación y {{{V}}} son las observaciones. |
| 50 | |
| 51 | === Los términos explicativos === |
| 52 | |
| 53 | El output en un modelo lineal es explicado como una suma de términos que denominamos términos explicativos. Los términos explicativos tienen la forma de un producto de un coeficiente, el parámetro, por una variable comúnmente denominada variable explicativa o input. El término explicativo se puede expresar como: |
| 54 | {{{ |
| 55 | E_i = β_i X_i |
| 56 | }}} |
| 57 | donde {{{E_i}}} es el término explicativo {{{i}}}-ésimo, {{{β_i}}} su parámetro y {{{X_i}}} su input. |
| 58 | |
| 59 | Los términos explicativos se pueden generalizar y así introducir relaciones no lineales como una función de varias variables explicativas y varios parámetros, que en general podemos denominar no-lineales: |
| 60 | {{{ |
| 61 | E_i = β_i f_i(U_j; δ_k) |
| 62 | }}} |
| 63 | donde {{{U_j}}} representa al conjunto de variables explicativas o inputs y {{{δ_k}}} al conjunto de parámetros no-lineales. Al factor {{{f_i(U_j; δ_k)}}} que sustituye al input {{{X_i}}} lo denominamos filtro del término explicativo. |
| 64 | |
| 65 | === El ruido === |
| 66 | |
| 67 | En un modelo lineal el término que recoge la parte no explicada del output se conoce como error, ruido o perturbación. Comúnmente este término admite las hipótesis de normalidad con media cero, varianza constante e independencia de las perturbaciones: |
| 68 | {{{ |
| 69 | E[N_i] = 0 |
| 70 | Var(N_i) = σ^2 |
| 71 | E[N_i N_(j≠i)] = 0 |
| 72 | }}} |
| 73 | es decir: |
| 74 | {{{ |
| 75 | N ~ Normal(0, σ^2 I) |
| 76 | }}} |
| 77 | |
| 78 | Los modelos lineales descritos se pueden extender si consideramos que el ruido tiene la estructura de un proceso ARIMA: |
| 79 | {{{ |
| 80 | N ~ ARIMA(R; ϕ_i, θ_j) |
| 81 | }}} |
| 82 | donde {{{ϕ_i}}} y {{{θ_j}}} son los parámetros de ruido ARIMA y {{{R}}} sus residuos que ahora representan a las perturbaciones que admiten la hipótesis de normalidad anterior: |
| 83 | {{{ |
| 84 | R ~ Normal(0, σ^2 I) |
| 85 | }}} |
| 86 | |
| 87 | == La jerarquía == |
| 88 | |
| 89 | Un modelo jerárquico se caracteriza por la posibilidad de expresar nuevas relaciones lineales entre sus parámetros, de modo que un parámetro o un conjunto de parámetro pueda describirse como una regresión con nuevos parámetros, conocidos como hiperparámetros. |
| 90 | |
| 91 | En MMS, estos nuevos modelos lineales sobre los parámetros de los submodelos se conocen como modelos de parámetros o jerarquías. De manera análoga a los submodelos una jerarquía está formada por un conjunto de parámetros explicados -el output-, un conjunto de términos explicativos y un ruido o parte no explicada. |
| 92 | |
| 93 | * Jerarquía |
| 94 | * Parámetros explicados |
| 95 | * Términos de la jerarquía |
| 96 | * Ruido |
| 97 | |
| 98 | Una jerarquía puede expresarse en forma de ecuación como: |
| 99 | {{{ |
| 100 | ζ = Sum_i(γ_i Z_i) + N |
| 101 | }}} |
| 102 | donde {{{ζ}}} representa al conjunto de parámetros explicados o output de la jerarquía, {{{H_i = γ_i Z_i}}} a cada uno de los términos explicativos de la jerarquía y {{{N}}} al ruido. |
| 103 | |
| 104 | === Output de la jerarquía === |
| 105 | |
| 106 | El output de la jerarquía es el conjunto o la selección de parámetros que va a expresarse como una regresión de los nuevos parámetros: |
| 107 | {{{ |
| 108 | ζ = {β_h} |
| 109 | }}} |
| 110 | |
| 111 | Este conjunto de parámetros {{{ {β_h} }}} no está limitado a los parámetros de los submodelos sino que puede estar formado por cualquier parámetro de un submodelo o de una jerarquía ya definida. |
| 112 | |
| 113 | Aún más, el output de una jerarquía puede estar formado por combinaciones lineales de parámetros, de modo que un elemento del output puede ser (i) un parámetro de un submodelo, (ii) un parámetro de una jerarquía o (iii) una combinación lineal de parámetros. |
| 114 | |
| 115 | De manera general podemos expresar cada elemento del output como: |
| 116 | {{{ |
| 117 | ζ_h = Sum_(i∈C_h)(α_(h,i) β_i) |
| 118 | }}} |
| 119 | donde {{{ζ_h}}} es el elemento {{{h}}}-ésimo del output y {{{α_(h,i)}}} son los coeficientes de la combinación lineal {{{C_h}}} de parámetros {{{β_i}}}. |
| 120 | |
| 121 | === Términos de la jerarquía === |
| 122 | |
| 123 | El output de la jerarquía, como en otro modelo lineal, es explicado como una suma de términos que aquí denominamos términos de la jerarquía. Éstos tienen la forma de un producto de un coeficiente, el hiperparámetro, por un conjunto de coeficientes que hacen las veces de inputs de la jerarquía y que dan significado a los hiperparámetros. El término de una jerarquía se puede expresar como: |
| 124 | {{{ |
| 125 | H_i = γ_i Z_i |
| 126 | }}} |
| 127 | donde {{{H_i}}} es el término {{{i}}}-ésimo, {{{γ_i}}} su hiperparámetro y {{{Z_i}}} el “hiperinput” que expresa las posibles relaciones lineales entre los parámetros explicados en la jerarquía. |
| 128 | |
| 129 | === Ruido === |
| 130 | |
| 131 | El término de ruido o perturbaciones de una jerarquía es similar al de un submodelo y comúnmente admite las hipótesis de normalidad con media cero, varianza constante e independencia: |
| 132 | {{{ |
| 133 | N ~ Normal(0, σ^2 I) |
| 134 | }}} |
| 135 | Este término puede extenderse eliminando la hipótesis de varianza constante e independencia entre las perturbaciones e introduciendo en general una matriz de covarianza de forma que: |
| 136 | {{{ |
| 137 | N ~ Normal(0, Σ) |
| 138 | }}} |
| 139 | donde {{{Σ}}} es la matriz de covarianza. |
| 140 | |
| 141 | == Información a priori == |
| 142 | |
| 143 | El modelo en MMS dispone de la posibilidad de añadir información a priori sobre los parámetros o sobre combinaciones lineales de ellos. |
| 144 | Esta información a priori puede ser de dos tipos: una distribución de probabilidad normal a priori y una restricción de dominio. Éstas pueden expresarse como: |
| 145 | {{{ |
| 146 | ζ_h^((0)) ~ Normal(μ_h, σ_h^2) |
| 147 | ζ_(h,min) < ζ_h < ζ_(h,max) |
| 148 | }}} |
| 149 | donde {{{ζ_h}}} es un parámetro o combinación de parámetros cualquiera del modelo, {{{μ_h}}} y {{{σ_h^2}}} son los parámetros de su distribución normal a priori, y {{{ζ_(h,min)}}} y {{{ζ_(h,max)}}} los extremos de su intervalo de dominio. |
| 150 | |
| 151 | |