Fundamentos de Econometría: Endogeneidad, Panel y Diferencias en Diferencias

EXOGENEIDAD (Cov(X,u)=0 o E[u/X=0]: Var. Explicativa no esta correlacionada con el error o el valor esperado del error, dadas las var. Explicativas, es 0. El contrario es ENDOGENEIDAD (MCO no es Consistente.

(1)
HOMOSCEDASTICIDAD (Var(ui/x)=o^2): Los individuos tienen la misma var. El contrario es HETEROSCEDASTICIDAD (Var(ui/x)=oí^2). (2)NO AUTOCORRELACIÓN (Cov(ui,uj/X=0): Los errores de un individuo no están correlacionados con los de otro. Los shocks que afectan hoy no dependen de los de ayer. Si (1)y(2)->MCO

INSESGADEZ

E[Beta^]=Beta. En promedio, la estimación da el valor real.

CONSISTENCIA

Con infinitos datos, el estimar convergería con prob. De 1 al valor real. Propiedades más preciadas del estimador MCO.

DIFERENCIA F.R Y F.E

La forma reducida consiste en expresar cada variable endógena únicamente en función de las var. Exógenas d todo el sistema eliminando la simultaneidad. En cambio, la forma estructural contiene más de una var. Endógena por ecuación y muestra como se determinan simultáneamente. En la F.E. Estimar por MCO genera estimaciones inconsistentes y la estimación por MCO en la F.R es consistente. Por último, los coeficientes (PI’S) miden el efecto total, ya que si cambia una exógena, esta afecta a todas las endógenas del sistema y los coeficientes (alpha y beta) miden el efecto directo de una variable sobre otra.

Requisitos indispensables para un instrumento válido

RELEVANCIA

El instrumento debe explicar con fuerza la variación de la variable endógena (Cov(Z,X) no igual a 0).

EXOGENEIDAD

El instrumento no debe tener relación con el error de la segunda etapa. Esto implica que no puede influir directamente sobre Y, sino únicamente a través de su efecto en X (Cov(Z,u)=0)

[p-valor >= alpha -> No Rechazo H0] 1)Test d Endogeneidad (D-W-H): H0: Var. Exógenas /H1: Var. Endógenas. Si rechazamos H0, confirmamos que la var. Es endógena y debemos instrumentarla. Existe endogeneidad en el sistema y que el uso de MC2E es necesario porque el MCO proporcionaría estimadores sesgados e inconsistentes.

2)Instr. Débiles:

H0:Ins. Débiles (F<10) lo que invalida la consistencia de las estimaciones en muestras finitas /H1:Ins. Fuertes (F>=10) Los ins. (var. Exó.) tienen una correlación muy fuerte con la var. Endógena, asegurando la fiabilidad de la estimación.

3)Sargan[Solo modelos SobreIdentificados]:

H0:Ins. Válidos (Esto implica que los instrumentos no están correlacionados con el término de error y confirma la validez de nuestra base instrumental) / H1: Al menos un instrumento es inválido.

Heterogeneidad es la existencia de alpha_i (los individuos son diferentes). Cov(Xit,alphai)=0 significa que la heterogeneidad
NO te da problemas (exogeneidad)
. Cov(Xit,alphai) distinta de 0 significa que la heterogeneidad SÍ te machaca el modelo (endogeneidad)
, obligándote a usar Efectos Fijos.

HETEROGENEIDAD INDIV. NO OBS

Se refiere al conjunto de caract. De cada ud. De análisis (personas, empresas, regiones o países) que influyen en la variable dependiente pero no son medibles en la base de datos (hab. Innata, talento de los fundadores, costumbres culturales). Es constante a lo largo de los periodos analizados para un mismo individuo, pero totalmente variable entre los distintos individuos de la muestra. Puede conducir a estimaciones sesgadas porque la het. Inobs. Suele estar directamente relacionada con las decisiones observables de los agentes (cov(xit/alphai) distinto de 0). Las unidades que poseen habilidades elevadas (alphai alto) tienden sistemáticamente a acumular más variables explicativas (xit alto). Al violarse el supuesto de exogeneidad por culpa de la heterogeneidad omitida, el modelo sufre un problema de endogeneidad. Esto provoca que el estimador MCO arroje resultados sesgados e inconsistentes porque al calcular el coeficiente beta, no sabe distinguir que parte del resultado (Y) se debe a la variable explicativa (X) y que parte se debe a la cualidad invisible. Este sesgo no desaparece ni aunque aumentemos el tamaño de la muestra a infinito (consistencia).

ERRORES ROBUSTOS O CLUSTERIZADOS:

como el efecto individual fijo (alphai) permanece constante a lo largo de todos los años para un mismo individuo, provoca que las observaciones de un mismo individuo estén correlacionadas entre sí a lo largo del tiempo. Incluso si eit fuera i.I.D y no mostrara autocorrelación, el término de error compuesto uit, sí presentaría autocorrelación a lo largo del tiempo debido al efecto persistente de alphai. La práctica consiste en estimar por MCO el Modelo TWFE y aplicar una corrección en la estimación de los errores estándar que tengan en cuenta la autocorrelación a lo largo del tiempo de cada unidad. Esta corrección se conoce como errores robustos o errores clusterizados.

1) MODELO POOL DE DATOS

Este modelo ignora por completo la estructura d panel y asume que todas las observaciones son indep.: Yit=B0+B1*X1it+B2*X2it+uit.

2)MODELO D EFECTOS FIJOS INDIVIDUALES

Introducimos alphai para controlar la heterogeneidad inobservable que no varía en el tiempo.: Yit=B1*X1it+B2*X2it+ALPHAi+Eit.

3)MODELO D EFECTOS FIJOS TEMPORALES

Introduce var. Dummies por cada año (8t) para aislar los shocks macroeconómicos o tendencias anuales que afectan a todas las empresas por igual.: Yit=B0+B1*X1it+B2*X2it+8t+Eit.

4)MODELO DE EFECTOS FIJOS INDIVIDUALES Y TEMPORALES (TWFE)

Controla ambas dimensiones simultáneamente (efectos fijos de empresa y de año): Yit=B1*X1it+B2*X2it+ALPHAi+8t+Eit

Explique en qué consiste el método de diferencias en diferencias (DiD)

El método de Diferencias en Diferencias (DiD) es un diseño de investigación cuasiexperimental que permite identificar y estimar el efecto causal de una intervención (tratamiento o política pública) utilizando datos observacionales. Su lógica se basa en la existencia de dos dimensiones de comparación simultáneas: 1) En la Dimensión Transversal se Compara un grupo que recibe la intervención (Grupo de Tratamiento, Di=1) con un grupo que no la recibe (Grupo de Control, Di=0). 2) En la Dimensión Temporal se Compara el comportamiento de la variable de resultado (Y) en un periodo anterior a la intervención (Pre-tratamiento, Post_t = 0) con un periodo posterior (Post-tratamiento, Post_t = 1). El estimador de DiD calcula el cambio temporal experimentado por el grupo de tratamiento y le resta el cambio temporal experimentado por el grupo de control. De este modo, se eliminan las Diferencias permanentes entre los grupos debidas a carácterísticas fijas (ej. Tamaño original de la empresa, localización o eficiencia de partida) y los Shocks cronológicos agregados que afectan
a ambos grupos por igual (ej. Inflación, ciclo económico o cambios globales de mercado). Matemáticamente, el estimador poblacional de Diferencias en Diferencias se define como:

Ecuación matemática estándar del modelo básico estimado en el DiD canónico

Yit=B0+B1*TREATEDi+B2*POSTt+8(TREATEDi*POSTt)+uit
Donde: 1) Yit: (Inversión bruta) (de la empresa) i en el año t. 2) treated_i: Variable dicotómica (dummy) de grupo. Toma el valor 1 si la “empresa” pertenece al grupo tratado y 0 si pertenece al grupo de control. 3) post_t: Variable dicotómica (dummy) de periodo. Toma el valor 1 para el periodo post-tratamiento y 0 para el periodo pre-tratamiento. 4) treated_i*post_t: Término de interacción (también denotado como dummy de política activa, did_it), que toma el valor 1 únicamente si la observación pertenece a una empresa tratada en un año posterior o igual a 1940. 5) u_it: Término de perturbación aleatoria (error idiosincrático). 6) beta_0 (Intercepto):
Representa el nivel medio esperado de inversión bruta de las empresas del grupo de control en el periodo previo al tratamiento (treated_i = 0, post_t = 0). 7) beta_1 (Diferencia de grupo): Mide la brecha permanente pre-tratamiento en los niveles de “inversión” entre ambos grupos. Captura la diferencia promedio entre el grupo de tratamiento y el de control antes de “1940” (Post_t = 0) 8) beta_2 (Efecto temporal común): Mide la tendencia temporal secular o común. Es el cambio medio en el nivel de “inversión” experimentado por el grupo de control de la etapa pre a la etapa post-tratamiento. Captura cualquier shock macroeconómico o tendencia cronológica ajena a la “política fiscal” que afecte a todas las empresas por igual. 9) 8(delta) (Efecto DiD / Parámetro causal): Es el coeficiente de la interacción (treated_i*post_t). Representa el “efecto causal neto promedio del incentivo fiscal sobre la inversión de las empresas tratadas (ATT)”. Limpia la estimación de la diferencia de niveles iniciales (beta_1) y de la tendencia temporal común (beta_2).

Modelo DiD con efectos fijos de dos vías (TWFE)

El modelo de efectos fijos bidireccionales o de dos vías (TWFE) traslada el análisis DiD a una estructura de panel estricta. Su formulación matemática es: Yit=8(“DELTA”*DIDit+ALPHAi+0t(THETA)+Eit
Donde: 1) did_it = treated_i*post_t es la variable que indica si la empresa i tiene la “política activa” en el periodo t. 2) alpha_i representa los efectos fijos individuales por empresa. Es un conjunto completo de dummies para cada empresa (menos una, o bajo transformación Within) que captura y elimina toda la heterogeneidad inobservable invariante en el tiempo específica de cada firma (cultura organizativa, sector, etc.). 3)theta_t representa los efectos fijos temporales por año. Es un conjunto completo de dummies anuales que captura y elimina todos los shocks o tendencias macroeconómicas temporales comunes que afectan a todas las empresas de forma idéntica en cada año específico. 4)epsilon_it es el error idiosincrático puramente aleatorio. En esta especificación TWFE, los términos individuales $treated_i$ y $post_t$ de la ecuación
canónica desaparecen del modelo (caen por colinealidad perfecta). El efecto estático de grupo queda absorbido dentro de las dummies de empresa y Al introducir efectos fijos temporales para cada año individual, la variable dummy de periodo sufre colinealidad perfecta y queda absorbida por completo dentro de las dummies anuales. El único parámetro que sobrevive a la doble transformación es el término de interacción did_{it}.

Explique la importancia del supuesto de «tendencias paralelas»

El supuesto de Tendencias Paralelas (Parallel Trends Assumption) es el supuesto de identificación más crítico y no negociable del método DiD. Establece que, en caso de no haberse introducido el tratamiento (incentivo fiscal), las trayectorias temporales de la variable explicada ($invest$) de ambos grupos (tratamiento y control) habrían evolucionado de forma exactamente paralela en el tiempo. Si las tendencias temporales previas eran divergentes debido a factores dinámicos no observados, el grupo de control deja de representar un contrafactual válido para proyectar Yit(0). El estimador $\8delta$ quedará sesgado e inconsistente, confundiendo la
divergencia natural de las tendencias con el efecto real de la política.