En econometría, uno de los supuestos fundamentales de los Mínimos Cuadrados Ordinarios (MCO) es que los regresores son exógenos, es decir, no están correlacionados con el término de error. Cuando este supuesto se viola, decimos que existe endogeneidad, y MCO produce estimaciones sesgadas e inconsistentes. Este sesgo no desaparece al aumentar el tamaño muestral: es un problema estructural del estimador.
La endogeneidad surge principalmente por tres causas: variable omitida (una variable que afecta a Y y correlaciona con X no se incluye en el modelo), simultaneidad (X afecta a Y, pero Y también afecta a X), y error de medida (X se observa con ruido). La causa más común en aplicaciones empíricas es la variable omitida.
Consideremos el modelo simple:
$$y_i = \beta_0 + \beta_1 x_i + u_i$$donde \(u_i\) es el término de error que puede contener variables omitidas.
El estimador MCO de la pendiente es:
$$\hat{\beta}_1^{MCO} = \frac{\sum_{i=1}^n (x_i - \bar{x})(y_i - \bar{y})}{\sum_{i=1}^n (x_i - \bar{x})^2}$$Sustituyendo el modelo verdadero y simplificando:
$$\hat{\beta}_1^{MCO} = \beta_1 + \frac{\sum_{i=1}^n (x_i - \bar{x})u_i}{\sum_{i=1}^n (x_i - \bar{x})^2}$$Si X y u son independientes, el segundo término converge a cero. Pero si existe correlación:
$$\hat{\beta}_1^{MCO} \xrightarrow{p} \beta_1 + \frac{\sigma_{xu}}{\sigma_x^2}$$El término \(\frac{\sigma_{xu}}{\sigma_x^2}\) es el sesgo de endogeneidad. No desaparece al aumentar n.
La violación del supuesto 2 (exogeneidad) genera el problema que estudiamos en esta aplicación. Cuando existe endogeneidad, MCO confunde el efecto causal genuino con correlaciones espurias, llevando a conclusiones erróneas sobre las relaciones económicas.