Estimador IV versus MCO

Variables Instrumentales: Solución al Problema de Endogeneidad

Cuando un regresor está correlacionado con el término de error, decimos que hay endogeneidad. Este problema hace que el estimador MCO sea sesgado e inconsistente: ningún aumento del tamaño muestral puede corregir el sesgo. La endogeneidad surge por tres causas principales: variables omitidas relevantes, simultaneidad (causalidad inversa), y errores de medida en los regresores.

Las variables instrumentales (IV) proporcionan una solución elegante. Un instrumento es una variable que está correlacionada con el regresor endógeno pero no con el término de error. Esto permite aislar la variación 'limpia' del regresor para estimar el efecto causal.

El Sesgo de MCO con Endogeneidad

Consideremos el modelo simple: $y_i = \beta_0 + \beta_1 x_i + u_i$

El estimador MCO converge a:

$$\hat{\beta}_1^{MCO} \xrightarrow{p} \beta_1 + \frac{\sigma_{xu}}{\sigma_x^2}$$

donde $\sigma_{xu} = \text{Cov}(x,u)$ es la covarianza entre el regresor y el error, y $\sigma_x^2 = \text{Var}(x)$ es la varianza del regresor. El término $\sigma_{xu}/\sigma_x^2$ es el sesgo de endogeneidad, que no desaparece al aumentar el tamaño muestral.

Las Dos Condiciones del Instrumento

Un instrumento válido $z$ debe cumplir simultáneamente:

Relevancia: $\text{Cov}(z,x) \neq 0$. El instrumento debe estar correlacionado con el regresor endógeno. Esta condición es verificable empíricamente mediante el estadístico F de la primera etapa.
Exogeneidad: $\text{Cov}(z,u) = 0$. El instrumento solo afecta a $y$ a través de $x$, no directamente. Esta condición no es verificable cuando el modelo está exactamente identificado.

El Estimador IV

El estimador IV explota la relación:

$$\beta_1 = \frac{\text{Cov}(z,y)}{\text{Cov}(z,x)}$$

El estimador muestral es:

$$\hat{\beta}_1^{IV} = \frac{\sum_{i=1}^n(z_i - \bar{z})(y_i - \bar{y})}{\sum_{i=1}^n(z_i - \bar{z})(x_i - \bar{x})}$$

Trade-off Sesgo-Varianza

IV es consistente pero menos eficiente que MCO. La varianza del estimador IV es:

$$\text{Var}(\hat{\beta}_1^{IV}) \approx \frac{\sigma_u^2}{n \cdot \sigma_x^2 \cdot \rho_{zx}^2}$$

donde $\rho_{zx}^2$ es el cuadrado de la correlación entre $z$ y $x$. Si el instrumento es débil ($\rho_{zx}^2$ pequeño), la varianza se dispara. Este es el precio de la consistencia: IV siempre tiene mayor varianza que MCO.

Variables Instrumentales: Solución al Problema de Endogeneidad

El Sesgo de MCO con Endogeneidad

Las Dos Condiciones del Instrumento

El Estimador IV

Trade-off Sesgo-Varianza

Parámetros de la Simulación

Estimaciones

Diagnósticos

Interpretación Econométrica