Introducción a la Econometría: Modelos, Estimación y Aplicaciones
Objetivos Fundamentales de la Econometría
– Análisis estructural: Es el uso del modelo econométrico estimado para efectuar la medición cuantitativa de relaciones económicas. También permite la comparación de teorías contrarias sobre un mismo fenómeno.
– Predicción: Es la aplicación de un modelo econométrico estimado para predecir valores cuantitativos de ciertas variables fuera de la muestra de datos realmente observados.
– Evaluación de políticas: Es el manejo de un modelo econométrico estimado para elegir entre políticas alternativas.
Modelo Económico vs. Modelo Econométrico
El proceso científico parte de unos axiomas o hipótesis científicas que, al confirmarse, pasan a la consideración de leyes y, al unificarse, se transforman en teorías. Bunge (1969) plantea de manera gráfica la diferencia entre teoría y modelo:
Por esta razón, la economía ha desarrollado modelos específicos para su aplicación a sistemas reales más concretos: los modelos econométricos. Modelos que han de basarse necesariamente en un modelo económico más o menos general y formalizado, y completarse con los aspectos particulares propios del sistema en estudio. Por tanto, perderá generalidad, pero al ajustarse más al tema en estudio, será mucho más válido.
El Concepto de Estructura
Al definir un modelo y estimar sus parámetros, pueden plantearse dudas sobre la permanencia estructural, tanto para el período de observación como para el futuro. El problema surge cuando consideramos una estructura fija (parámetros constantes) y no lo son; ante esta situación, estaremos trabajando con un modelo que se aleja de la realidad. Se ha de contrastar la variación de los parámetros, de tal manera que no se cometan fallos. Ahora bien, un cambio de estructura admite diversos grados de complejidad según que:
a) Se mantengan las mismas variables del modelo y solo cambien el valor de los coeficientes.
b) Se incorporen nuevas variables al modelo (cambian los coeficientes), pero se mantenga básicamente el sistema original.
c) Se incorporen nuevas variables al modelo que corresponden a un nuevo sistema.
Variables del Modelo Econométrico
– Endógenas (o dependientes) (Y): Son las que estudiamos, las variables a explicar. Por ejemplo, la variable PIB del modelo: PIBt = f(VASt, VAAt, tit, PIBt-1)
– Exógenas (o explicativas) (X): Son las que explican. Por ejemplo: VAS, VAA, ti.
– Predeterminadas: Conjunto de variables exógenas y endógenas desplazadas (PIBt-1).
– Matemáticas (Deterministas): Variables que vienen dadas.
– Estocásticas (Ut): Variables que no vienen dadas.
Etapas en la Construcción de un Modelo Econométrico
1. Especificación inicial:
– Relación funcional.
– Variables y parámetros.
2. Estimación y contraste:
– Estimación de coeficientes.
– Contraste de hipótesis.
3. Validación:
– Bondad del ajuste.
– Contrastes no paramétricos.
4. Utilización del modelo:
– Predicción.
– Evaluación de políticas.
– Control óptimo.
Problemas Atribuibles a la Fuente Estadística
– Lagunas estadísticas: No siempre, por diversas razones, existen todos los datos referentes a un fenómeno. Bien por conflictos bélicos, bien por otros problemas, aparecen variables con datos conocidos antes y después de estos hechos.
– Cambios metodológicos: Cuando extraemos información de una fuente estadística, debemos prestar atención a los posibles cambios en la variable: cambios metodológicos conceptuales o cambios metodológicos de valoración.
Problemas Atribuibles al Método de Obtención
– Errores de muestreo: Por la simple equivocación al realizar el muestreo, o por errores al transcribir los resultados del muestreo.
– Errores de observación y/o medida: Los datos están sujetos a diversas imprecisiones y desviaciones. De hecho, los datos a menudo son revisados debido a un reconocimiento posterior de estas imprecisiones y desviaciones. Las imprecisiones suelen provocarse por la falta de una correcta conceptualización. Si existen cambios en la conceptualización, se han de reconfigurar los datos para poder hacerlos comparables y consistentes en el tiempo.
Cambios Estructurales
Provocados por:
– Cambios en el año base de referencia: Podemos estar trabajando con una serie con observaciones hasta el año 1999 y encontrarnos con datos hasta el 90 con año base 80, y a partir de 1991 con año base 86. No podemos mezclarlos, habría que transformar uno de los dos en el año base del otro.
– Datos estructuralmente heterogéneos: Puede producirse un cambio discontinuo en el mundo real de modo que los datos se refieran a diferentes poblaciones. Recurriendo al ejemplo de conflictos bélicos, la situación anterior y posterior a este conflicto es diferente: menos población, tejidos industriales destruidos, etc.
Especificación del Modelo Lineal
Suponemos el comportamiento de una variable endógena que puede ser explicado mediante una relación lineal de k variables exógenas, xj, más un término de error u:
y = β1x1 + β2x2 + …… + βkxk + u.
Partimos de «N» observaciones seleccionadas del sistema real: (yi ; x1i , x2i , …… ,xki) para i = 1, 2, 3, ……, n. Se podrá plantear un sistema de ecuaciones en el que cada ecuación será el modelo definido para cada uno de los «n» datos:
y1 = β1x11 + β2x21 + …… + βkxk1 + u1
y2 = β1x12 + β2x22 + …… + βkxk2 + u2
…
yn = β1x1n + β2x2n + …… + βkxkn + un
Este sistema tiene (n-k) grados de libertad, pues hay que estimar «K» parámetros, considerando «n» observaciones. De forma matricial:
Se representa: Y = Xβ + u
(nx1) (nxk) (Kx1) (nx1).
Habitualmente se trabaja con término independiente, con lo cual, en la matriz X aparecerá una primera columna de 1:
Se denomina modelo básico, ya que juega un papel fundamental en la modelización econométrica, cuando se simplifica al máximo mediante las siguientes hipótesis:
- Las variables exógenas son no estocásticas, y no existe entre ellas ninguna relación lineal exacta.
- El término de error o perturbación aleatoria tiene media nula y varianza constante para todas las observaciones.
- No existe correlación entre los errores correspondientes a observaciones diferentes.
Estimador MCO (Mínimo Cuadrático Ordinario) de β̂:
Son aquellos que hacen mínima la suma de las diferencias al cuadrado entre los valores reales y estimados de la variable endógena:
De modo matricial: S = (y – Xβ̂)’ (y – Xβ̂) = û’û Si aplicamos la condición de mínimo:
- Derivadas parciales respecto al estimador = 0.
- Segundas derivadas positivas.
Estimador MV (Máximo Verosímil):
Serán aquellos que son más probables. Para aplicarlo, debemos acudir a la hipótesis de normalidad: u → N (0, σ2I)
Teniendo en cuenta esta hipótesis, y la función de densidad de la distribución normal: f (x) = (2π)–n/2 (σ2)–n/2 exp – [(xi – x)/ 2σ2]. La función de densidad conjunta, normal multivariante será: f (u) = (2π)–n/2 (σ2)–n/2 exp – (u’u/ 2σ2). La función logarítmica de verosimilitud para los valores muestrales u = y – Xβ, y siendo β̂ el vector de estimadores MV: L = – n/2 ln 2π – n/2 ln σ2 – 1/ 2σ2 (y – Xβ̂)’ (y – Xβ̂). El máximo respecto a β̂ coincide con el mínimo del tercer sumando, ya que es el único que depende de β̂: Máx β̂ L = mín β̂ (y – Xβ̂)’ (y – Xβ̂). POR TANTO:
Distribución y Propiedades de los Estimadores β̂j
Los estimadores son una combinación lineal de los valores de las variables exógenas: β̂ = (X’X)-1X’y = Wy. El estimador y el parámetro dependerán en función de la distribución de la perturbación aleatoria:
Es decir, la diferencia entre el estimador y el parámetro será una función lineal de los términos de error del modelo.
– En media: Coinciden estimador y parámetro:
– En varianza y covarianzas:
Es decir, para conocer las varianzas y covarianzas de los parámetros, necesitamos el valor de la varianza poblacional, σ2, de la perturbación aleatoria. Por tanto, habrá que conseguir un estimador de esta varianza. Admitiremos una distribución Normal de u:
De otro modo:
Consecuencia directa: existencia de covarianzas NO nulas, y por tanto, las distribuciones de los parámetros NO pueden considerarse independientes. Pero, en la práctica, se viene utilizando aquellos estimadores que tengan la varianza más pequeña, es decir, los más EFICIENTES entre todos los estimadores LINEALES posibles, y que sean INSESGADOS.
Contraste de Significación Individual
1) Significación económica (signos): Para todo parámetro, que su SIGNO corresponda con el que cabe esperar a priori en base a los conocimientos teóricos referente a las relaciones entre las variables: relación directa –> + ; relación inversa –> –
2) Contraste de significación individual (t-Student): Hay que tener muy presente, a la hora de analizar la contribución de cada variable, que se podrá realizar esta comparación cuando las variables se presenten en las mismas unidades de medida. Solo en estos casos podemos considerar que una variable es más importante que otra. En caso contrario, habrá que analizar detenidamente cada parámetro en función de las unidades en que viene medida la variable, o bien, estandarizar los parámetros para poder compararlos. Los parámetros se obtendrán:
Utilizaremos la distribución t de Student con (n – k) g.l.:
Cuando en valor absoluto, la t calculada esté por debajo de 2, es muy probable que esa variable no ejerza una influencia significativa sobre la variable endógena. Si |βj / S(βj)| > tα/2 ; n-k , se rechazará H0: βj = 0. Y esa variable no será significativa. Habrá que eliminarla del modelo e introducir otra.
Contraste de Significación Conjunta
1) Contraste F-Snedecor:
2) Coeficiente de determinación corregido (bondad de ajuste): Hay que hacer unas matizaciones:
- Se deberá corregir el R2 con los g.l. en cada caso.
- Debemos saber interpretar el R2.