Censura y sesgo de MCO
  • Teoría
  • Simulación interactiva
  • Resultados e interpretación

Censura y sesgo de Mínimos Cuadrados Ordinarios

En muchas aplicaciones econométricas, la variable dependiente no puede observarse en todo su rango teórico. Un ejemplo típico es el gasto en seguros médicos: aunque conceptualmente un hogar podría tener una 'demanda óptima' negativa (preferir recibir dinero por no contratar seguro), en la práctica lo mínimo que puede gastar es cero. Esta situación genera lo que denominamos datos censurados.

La censura por la izquierda ocurre cuando existe una variable latente continua \(y_i^*\) que representa el proceso económico subyacente, pero solo observamos:

$$y_i = \begin{cases} y_i^* = \mathbf{x}_i'\boldsymbol{\beta} + u_i & \text{si } y_i^* > 0 \\ 0 & \text{si } y_i^* \leq 0 \end{cases}$$

donde \(y_i^*\) es la variable latente, \(\mathbf{x}_i\) es el vector de regresores, \(\boldsymbol{\beta}\) son los parámetros estructurales, y \(u_i \sim N(0, \sigma^2)\) es el término de error.

El problema fundamental: inconsistencia de MCO

Cuando aplicamos MCO directamente a los datos censurados, el estimador es inconsistente. La razón es que la esperanza condicional de la variable observada no es lineal en los regresores:

$$E[y_i | \mathbf{x}_i] = \Phi\left(\frac{\mathbf{x}_i'\boldsymbol{\beta}}{\sigma}\right) \cdot \left[\mathbf{x}_i'\boldsymbol{\beta} + \sigma \cdot \frac{\phi(z_i)}{\Phi(z_i)}\right]$$

donde \(\Phi(\cdot)\) es la función de distribución acumulada normal estándar, \(\phi(\cdot)\) es su densidad, y \(z_i = \mathbf{x}_i'\boldsymbol{\beta}/\sigma\). Esta expresión muestra que la relación entre \(E[y_i|\mathbf{x}_i]\) y \(\mathbf{x}_i\) es no lineal y depende de la proporción de observaciones censuradas.

Supuestos del modelo Tobit

  1. Normalidad: \(u_i \sim N(0, \sigma^2)\). Crucial para la identificación, ya que determina la forma funcional de las probabilidades de censura.
  2. Homocedasticidad: \(\text{Var}(u_i|\mathbf{x}_i) = \sigma^2\) constante. Su violación causa inconsistencia, no solo ineficiencia.
  3. Independencia: Las observaciones son independientes entre sí.
  4. Especificación lineal: La variable latente depende linealmente de los regresores.
  5. Exogeneidad: \(E[u_i|\mathbf{x}_i] = 0\), los regresores son exógenos.

La violación de cualquiera de estos supuestos, especialmente normalidad y homocedasticidad, produce estimaciones inconsistentes en el modelo Tobit, a diferencia de MCO donde algunas violaciones solo afectan la eficiencia.

Parámetros de simulación


Estimaciones comparadas

Estadísticas descriptivas


Interpretación econométrica