Modelos de Regresión Lineal Aplicados a Importaciones, Salarios e Ingresos: Estimación y Contraste de Hipótesis

Modelización de Importaciones de Cloruro de Bario (chnimp)

Definición de Variables Explicativas

  • chnimp: Importaciones de cloruro de bario procedentes de China (toneladas).
  • chempi: Índice de producción química en EE. UU. Refleja el nivel de actividad del sector químico doméstico. Si esta variable aumenta, significa que hay más demanda interna de productos químicos, lo que puede aumentar las importaciones de bario o reducirlas (si la producción nacional sustituye a las importaciones).
  • gas: Producción de gasolina (barriles). Se usa como otra medida de actividad industrial o económica general. En modelos de este tipo, sirve para controlar el ciclo económico: cuando la economía produce más gasolina, también puede estar demandando más productos químicos.
  • rtwex: Índice del tipo de cambio real ponderado por comercio. Mide la fortaleza del dólar frente a otras monedas, ajustado por precios y ponderado según el comercio con cada socio. Si el rtwex sube, significa un dólar fuerte, las importaciones desde China son más baratas, y podrían aumentar.

Modelo de Regresión Lineal y Estimación

Se considera el siguiente modelo de regresión lineal que analiza cómo las importaciones procedentes de China (chnimp) dependen de la actividad industrial y del tipo de cambio:

$$chnimp_t = \beta_0 + \beta_1 chempi_t + \beta_2 gas_t + \beta_3 rtwex_t + \epsilon_t$$

El modelo estimado es:

$$\hat{chnimp} = -1.327 \cdot 10^3 + 11.72 \cdot chempi + 2.703 \cdot 10^{-8} \cdot gas + 2.406 \cdot rtwex$$

Interpretación de los Coeficientes Estimados

  • $\hat{\beta}_0 = -1.327 \cdot 10^3$: Valor esperado de las importaciones de cloruro de bario en EE. UU. procedentes de China si el índice de producción química, la producción de gasolina y el índice del tipo de cambio real fueran nulos.
  • $\hat{\beta}_1 = 11.72$: Aumento esperado de las importaciones de cloruro de bario en EE. UU. procedentes de China cuando el índice de producción química se incrementa en un punto, ceteris paribus.
  • $\hat{\beta}_2 = 2.703 \cdot 10^{-8}$: Aumento esperado de las importaciones de cloruro de bario en EE. UU. procedentes de China cuando la producción de gasolina se incrementa en un barril, ceteris paribus.
  • $\hat{\beta}_3 = 2.406$: Aumento esperado de las importaciones de cloruro de bario en EE. UU. procedentes de China cuando el índice del tipo de cambio real se incrementa en un punto, ceteris paribus.

Aparentemente, según este modelo, los regresores gas y rtwex no son significativos.

Test de Chow para Estabilidad Estructural

En julio de 2014 se presentó una denuncia antidumping que pudo producir un cambio estructural en la relación entre las importaciones y las variables explicativas. Sabiendo que ese punto de corte se corresponde con el periodo $t = 78$, se realiza un Test de Chow para contrastar la hipótesis de estabilidad estructural de los parámetros del modelo.

Formulación de Hipótesis

El Test de Chow tiene la siguiente hipótesis nula:

$$H_0: \beta_i^{(1)} = \beta_i^{(2)}, \quad i = 0, 1, 2, 3$$

Donde:

  • $\beta_i^{(1)}$ son los parámetros del modelo estimado con la primera submuestra ($t = 1, 2, \dots, 77$).
  • $\beta_i^{(2)}$ son los parámetros del modelo estimado con la segunda submuestra ($t = 78, 79, \dots, 131$).

La hipótesis alternativa ($H_1$) es que al menos un par de parámetros es diferente ($\beta_i^{(1)} \neq \beta_i^{(2)}$ para algún $i$).

Estadístico F del Test de Chow

El estadístico de contraste es:

$$F^* = \frac{(SCR_R – SCR)/q}{SCR/(n – 2(k+1))}$$

Donde:

  • $q = k+1 = 4$ (número de restricciones, igual al número de parámetros).
  • $n = 131$ (tamaño total de la muestra).
  • $SCR_R$ es la Suma de Cuadrados de los Residuos del modelo original (restringido, estimado con toda la muestra).
  • $SCR = SCR^{(1)} + SCR^{(2)}$, es decir, la Suma de Cuadrados de los Residuos del modelo estimado con la primera submuestra más la del modelo estimado con la segunda submuestra (modelo no restringido).

Criterio de Rechazo y Conclusión

Se rechaza $H_0$ si $prob(F^*) < \alpha$.

Dado que $prob(F^*) = 0.01401 < \alpha = 0.05$, entonces se rechaza $H_0$.

Esto implica que al menos uno de los parámetros $\beta_i$ del modelo no es igual en el primer periodo y en el segundo. Por lo tanto, existe un cambio estructural significativo en la relación entre las variables del modelo antes y después de la denuncia antidumping.

Implicaciones: El comportamiento de las importaciones de cloruro de bario (por ejemplo, su relación con la producción química, el tipo de cambio o la producción de gasolina) cambió de forma estadísticamente significativa a partir de la denuncia. Esto sugiere que la estabilidad del mercado del cloruro de bario se vio afectada por la intervención regulatoria.

Modelización de la Determinación del Salario por Hora (wage)

a) Modelo Mixto Planteado

Se considera un modelo de regresión lineal que analiza cómo el salario por hora (wage) depende de la experiencia laboral (exper), la escolaridad (educ) y la apariencia física (looks).

Como no se sabe si el hecho de ser mujer afecta solo al término independiente del modelo o también a la influencia de los regresores, se plantea un modelo mixto (con variables dummy de interacción):

$$wage_i = \beta_0 + \delta_0 \cdot female_i + \beta_1 \cdot educ_i + \delta_1 \cdot female_i \cdot educ_i + \beta_2 \cdot exper_i + \delta_2 \cdot female_i \cdot exper_i + \beta_3 \cdot looks_i + \delta_3 \cdot female_i \cdot looks_i + \epsilon_i$$

El modelo estimado es:

$$\hat{wage} = -1.99 – 0.26 \cdot female + 0.48 \cdot educ – 0.11 \cdot female \cdot educ + 0.10 \cdot exper – 0.06 \cdot female \cdot exper + 0.37 \cdot looks – 0.01 \cdot female \cdot looks$$

b) Influencia de la Variable ‘female’ en la Determinación del Salario

Para analizar si el hecho de ser mujer influye de alguna forma en la determinación del salario, se realiza el siguiente contraste de hipótesis conjunta:

$$H_0: \delta_0 = \delta_1 = \delta_2 = \delta_3 = 0$$

El estadístico de contraste $F^*$ es:

$$F^* = \frac{(SCR_R – SCR)/q}{SCR/(n – (k+1))}$$

Donde $q=4$, $k=7$, $n=1260$, y $SCR_R$ es la Suma de Cuadrados de los Residuos del modelo restringido (el que cumple $H_0$):

$$wage_i = \beta_0 + \beta_1 \cdot exper_i + \beta_2 \cdot educ_i + \beta_3 \cdot looks_i + \epsilon_i$$

Se rechaza $H_0$ si $prob(F^*) < \alpha$.

Dado que $prob(F^*) < 2.12 \cdot 10^{-16} < \alpha = 0.05$, entonces se rechaza $H_0$.

Esto implica que alguno de los parámetros $\delta_i$ no es nulo y, por lo tanto, el hecho de ser mujer influye de alguna forma en la determinación del salario.

c) Significatividad Individual de los Parámetros

Para analizar la significatividad del primer regresor (female) se realiza el siguiente contraste:

$$H_0: \delta_0 = 0$$

El estadístico $t$ es $t_{\delta_0}^* = \hat{\delta}_0 / \sqrt{VAR(\hat{\delta}_0)}$. Se rechaza $H_0$ si $prob(|t^*|) < \alpha$.

Dado que $prob(t_{\delta_0}^*) = 0.8779 > \alpha = 0.05$, entonces no se rechaza $H_0$.

Esto implica que el parámetro $\delta_0$ es nulo y, por lo tanto, el regresor “female” no es significativo individualmente. Lo mismo ocurre con “looks”, “female $\cdot$ educ” y “female $\cdot$ looks”.

Proceso de Eliminación: Los regresores no significativos se eliminan del modelo de uno en uno, empezando por el menos significativo (el que tiene mayor probabilidad): “female $\cdot$ looks”, y luego “female”.

Modelo Estimado Tras la Eliminación de Variables No Significativas

El nuevo modelo estimado es:

$$\hat{wage} = -2.09 + 0.49 \cdot educ – 0.13 \cdot female \cdot educ + 0.11 \cdot exper – 0.06 \cdot female \cdot exper + 0.37 \cdot looks$$

Que corresponde al siguiente modelo teórico:

$$wage_i = \beta_0 + \beta_1 \cdot educ_i + \delta_1 \cdot female_i \cdot educ_i + \beta_2 \cdot exper_i + \delta_2 \cdot female_i \cdot exper_i + \beta_3 \cdot looks_i + \epsilon_i$$

d) Influencia de ‘female’ en el Salario (Modelo Reducido)

Para analizar si, según este modelo reducido, el hecho de ser mujer influye en la determinación del salario, se realiza el siguiente contraste:

$$H_0: \delta_1 = \delta_2 = 0$$

El estadístico $F^*$ es:

$$F^* = \frac{(SCR_R – SCR)/q}{SCR/(n – (k+1))}$$

Donde $q=2$, $k=5$, $n=1260$, y $SCR_R$ es la Suma de Cuadrados de los Residuos del modelo restringido (el que cumple $H_0$):

$$wage_i = \beta_0 + \beta_1 \cdot exper_i + \beta_2 \cdot educ_i + \beta_3 \cdot looks_i + \epsilon_i$$

Se rechaza $H_0$ si $prob(F^*) < \alpha$.

Dado que $prob(F^*) < 2.12 \cdot 10^{-16} < \alpha = 0.05$, entonces se rechaza $H_0$.

Esto implica que alguno de los parámetros $\delta_i$ no es nulo y, por lo tanto, el hecho de ser mujer influye significativamente en la determinación del salario.

e) Significado de los Parámetros del Modelo Estimado

El modelo estimado es el obtenido en el punto (c):

$$\hat{wage} = -2.09 + 0.49 \cdot educ – 0.13 \cdot female \cdot educ + 0.11 \cdot exper – 0.06 \cdot female \cdot exper + 0.37 \cdot looks$$

Para explicar el significado de los parámetros, se obtiene el valor esperado de la variable dependiente para cada categoría de la variable ficticia.

Salario Esperado para Hombres ($female_i = 0$)

$$E[\hat{wage} | female_i = 0] = -2.09 + 0.49 \cdot educ + 0.11 \cdot exper + 0.37 \cdot looks$$

Salario Esperado para Mujeres ($female_i = 1$)

$$E[\hat{wage} | female_i = 1] = -2.09 + (0.49 – 0.13) \cdot educ + (0.11 – 0.06) \cdot exper + 0.37 \cdot looks$$

Interpretación de los Coeficientes

  • $\hat{\beta}_0 = -2.09$: Valor esperado del salario por hora para un hombre con 0 años de educación, 0 años de experiencia laboral y un valor 0 en la escala de apariencia.
  • $\hat{\beta}_1 = 0.49$: Aumento salarial para un trabajador (hombre) por cada año más de educación, ceteris paribus.
  • $\hat{\delta}_1 = -0.13$: Diferencia en el aumento salarial por educación entre un hombre y una mujer. El efecto marginal de la educación es menor para las mujeres ($0.49 – 0.13 = 0.36$).
  • $\hat{\beta}_2 = 0.11$: Aumento salarial para un trabajador (hombre) por cada año más de experiencia, ceteris paribus.
  • $\hat{\delta}_2 = -0.06$: Diferencia en el aumento salarial por experiencia entre un hombre y una mujer. El efecto marginal de la experiencia es menor para las mujeres ($0.11 – 0.06 = 0.05$).
  • $\hat{\beta}_3 = 0.37$: Aumento salarial para un trabajador, sea hombre o sea mujer, por cada punto adicional en la escala de apariencia, ceteris paribus.

Modelización de la Determinación del Ingreso Anual (inc)

a) Estimación del Modelo Inicial

El modelo a estimar analiza de qué forma el ingreso anual (inc) está determinado por el tamaño del hogar (size), la educación (educ) y la edad (age).

El modelo teórico es:

$$inc = \beta_0 + \beta_1 \cdot size + \beta_2 \cdot educ + \beta_3 \cdot age + \epsilon$$

El modelo estimado es:

$$\hat{inc} = -10232.38 – 98.77 \cdot size + 867.93 \cdot educ + 272.19 \cdot age + e$$

b) Bondad del Ajuste del Modelo

El coeficiente de determinación múltiple es $R^2 = 0.3376$.

Esto indica que el modelo (a través de sus regresores) explica el 33.76% de la variabilidad de la variable dependiente (el ingreso anual).

c) Significatividad Conjunta del Modelo

En el contraste de significatividad conjunta se analiza la hipótesis nula:

$$H_0: \beta_1 = \beta_2 = \beta_3 = 0$$

En este modelo, $prob(F^*) = 1.21 \cdot 10^{-8}$.

Como $prob(F^*) < 0.05 = \alpha$, se llega a la conclusión de rechazar $H_0$.

Esto significa que al menos uno de los regresores del modelo es significativo a la hora de explicar la variable dependiente.

d) Significatividad Individual y Modificación del Modelo

Se analiza la significatividad individual de todos los parámetros. Por ejemplo, para la variable “size”:

$$H_0: \beta_1 = 0$$

La probabilidad del estadístico $t^*$ de este contraste es $prob(t^*) = 0.75710$.

Como $prob(t_1^*) > 0.05 = \alpha$, se llega a la conclusión de no rechazar $H_0$.

Esto significa que el regresor “size” no es significativo a la hora de explicar la variable dependiente y se debe eliminar del modelo. Por lo tanto, se estima de nuevo omitiendo ese regresor.

f) Modelo Estimado Final e Interpretación de Parámetros

El nuevo modelo estimado (tras eliminar size) es:

$$\hat{inc} = -10858.40 + 869.85 \cdot educ + 276.68 \cdot age + e$$

Interpretación de los Coeficientes

  • $\hat{\beta}_0 = -10858.40$: Valor esperado del ingreso anual del hogar si los dos regresores (educ y age) fueran nulos.
  • $\hat{\beta}_1 = 869.85$: Aumento esperado del ingreso anual del hogar si se incrementa en un año la educación del cabeza de familia, permaneciendo su edad constante (ceteris paribus).
  • $\hat{\beta}_2 = 276.68$: Aumento esperado del ingreso anual del hogar si se incrementa en un año la edad del cabeza de familia, permaneciendo su educación constante (ceteris paribus).