Cómo Especificar y Estimar Modelos Econométricos: Una Guía Completa
Una vez que se establece la pregunta, vamos a utilizar el modelo econométrico basado en el modelo lineal general que viene dado por Yt=B1+B2*Xt2+B3*Xt3+…+Bk*Xtk+Et donde t=1, 2, 3…, N
1. Identificar la Variable Objetivo (Variable de Interés)
2. Acudir a la Teoría Económica y Ver Qué Dice Sobre la Variable
(Depende de lo que trate la pregunta y sea la variable de interés)
- Teoría del capital humano: Supone que el salario por hora que recibe una persona depende tanto de la educación formal que haya recibido como de su experiencia laboral (hay que ver si están esas variables en el ejercicio) (aparte de las variables que da en el ejercicio).
- Teoría del salario: Tratamos de explicar el salario por hora que percibe un individuo en función de dos variables: por un lado, el nivel educativo que esa persona tiene y, por otro, el sexo del individuo.
Los precios sombra determinan el precio del producto en base a sus características. El modelo se especificaba en base al modelo que habían hecho otros.
4. Verificar si hay Cambio Estructural con Modelo Restringido y Modelo sin Restringir
3. Especificar el Modelo
Decidimos tomar logaritmos en la variable dependiente Y para aproximar su distribución a una normal y así conseguir que tenga homocedasticidad. Además, de esta forma nos referimos en términos porcentuales. El resto de las variables no las transformamos para así trabajar con una semielasticidad constante. (Poner el modelo entero con todas las variables. Además, cuando tengo variables ficticias tengo que meter n-1 o, si meto todas las variables, tengo que quitar el término constante (c) para no tener multicolinealidad). Variables cualitativas (0 o 1) = variables ficticias. Son propiedades que hacen que el modelo lineal simple solo se pueda usar con garantías si se cumplen varios supuestos, y uno de ellos es que Et sea ruido blanco.
4. Interpretar los Coeficientes
(Hay que distinguir si las variables son discretas o continuas).
- B2 (continua): B2*100 es el porcentaje en el que va a aumentar la variable Y al aumentar B2 en un punto porcentual (hay Ln) o en una unidad (no hay Ln), manteniendo constante el resto de las variables (ceteris paribus).
- Discreta: Es la diferencia en porcentaje entre lo que se espera que gane un X de B2 y lo que gane un X de la variable ficticia que hemos quitado.
- B3, B4, B5…: Todas igual.
- B1: Es un parámetro desconocido que medirá el valor esperado de la variable Y cuando todas las variables explicativas valgan cero, es decir, E(V. Y / h=0 J=0…).
Va multiplicando a una variable constante, discreta, que no puede tomar cualquier valor en el intervalo de la recta.
5. Estimar el Modelo
Nuestra pregunta… para ello tendremos que ver si se cumple la hipótesis nula, Ho: Bk=0. Si es así, no hay…, es decir, hemos pasado de una pregunta teórica a una pregunta paramétrica y para resolverlo hay varias formas; una de ellas es construir un intervalo de confianza del 95% para Bk y ver si el cero está dentro del intervalo de confianza. Pero antes de hacer el IC hay que ver si se cumplen todos los supuestos del MLG. Si algún supuesto no se cumple, no se va a poder construir el IC y, por lo tanto, habrá que transformar las variables, ya que no estarían bien definidas.
6. Verificar si se Cumplen los Supuestos
- Y: Es la variable dependiente; tiene que ser continua y estocástica (porque queremos llegar a predecir el valor real, aunque solo lo vamos a estimar).
- X: Es una variable no estocástica y linealmente independiente, ya que si no fuera así no habría multicolinealidad. Además, el determinante de X`X sería cero y no tendría inversa, por lo que los B^ no podrían hallarse.
- B: Son parámetros desconocidos donde se centra nuestro interés, queremos conocerlos. Nos dan información relevante, porque todos tienen un significado. Tienen que ser constantes, no pueden cambiar en el tiempo, ni entre individuos.
Para que se dé esto, supongo directamente que los B son constantes.
Et: Es una variable aleatoria porque me va a medir una serie de efectos que no están recogidos en un modelo. Para ver si se cumple este modelo, hay que ver si hay ruido blanco:
- Distribución normal para todo t (E-N (0, 1)): Hay estadísticos a los que les afectan más los valores extremos y a otros menos. El estadístico Jarque Bera se ve afectado por las variables extremas. Un valor p (probabilidad) pequeño implica siempre rechazo de la hipótesis. P valor < 0.05 es pequeño si el contraste lo estamos haciendo al 95%. P valor < 0.01 es pequeño si el contraste se hace al 90% o al 1%. Todos los estadísticos de contraste tienen su p valor.
- La esperanza de los E tiene que ser cero (E(Et)=0): Está relacionado con variables importantes omitidas. Si tenemos constancia de ese hecho, hace que la evidencia sea incorrecta, ya que nunca podría ser cero. Si omitimos variables, van a estar en el término de perturbación y, por ello, nunca puede ser cero. No es un supuesto contrastable.
- Homocedasticidad, E(E2)= Varianza2 para todo t: Tiene que ver con las variables excluidas, con dos poblaciones y con las propiedades estadísticas que tenga la variable dependiente (variable a explicar). Muchas cosas no se saben porque es heterocedástica.
- Ausencia de autocorrelación, (Et*Es)=0 para todo t: Es muy razonable cuando se usan los datos de sección cruzada.
Suponiendo que todos los supuestos se cumplen de forma razonable, estamos autorizados a dar el paso siguiente. Todo será verdad en la medida que todos los supuestos son válidos.
7. Contrastar la Hipótesis
Contrasto la significatividad individual. Tengo que quitar las variables irrelevantes cuando el valor p es mayor a 0.05, por lo tanto, acepto la hipótesis y la variable no es significativa, y la tengo que quitar. Cuando llego a quitar todas las variables irrelevantes, tengo el modelo restringido. En un principio, no queremos omitir ninguna variable relevante porque, si omitimos alguna variable relevante, el estimador será sesgado. Si restrinjo mi modelo con restricciones ciertas, aumenta la precisión.
8. Intervalo de Confianza (IC) para el 95% (solo B de la pregunta)
Vamos a construir un IC del 95% para comprobar la hipótesis nula.
Ho: Bk=0 B^+/-2 D (coef. +/- 2std error).