Modelos ordenados y variable latente

Modelos de elección ordenada

Los modelos de elección ordenada se utilizan cuando la variable dependiente es categórica con un orden natural. A diferencia de las variables nominales (como la elección entre medios de transporte), las variables ordinales tienen una jerarquía clara: satisfacción laboral (muy insatisfecho, insatisfecho, neutral, satisfecho, muy satisfecho), calificación crediticia (AAA, AA, A, BBB, BB, B), o nivel de acuerdo con una política (totalmente en desacuerdo a totalmente de acuerdo).

El modelo parte de una variable latente continua no observada que representa la propensión subyacente del individuo. Esta variable latente se transforma en categorías observables mediante umbrales que dividen el espacio continuo en regiones discretas.

Especificación del modelo

La variable latente continua se especifica como:

$$y_i^* = \mathbf{x}_i'\boldsymbol{\beta} + u_i$$

donde $y_i^*$ es la variable latente no observada, $\mathbf{x}_i$ es el vector de regresores, $\boldsymbol{\beta}$ es el vector de parámetros a estimar, y $u_i$ es el término de error.

La variable observada $y_i \in \{1, 2, \ldots, J\}$ se obtiene mediante umbrales:

$$y_i = j \quad \text{si} \quad \mu_{j-1} < y_i^* \leq \mu_j$$

con $\mu_0 = -\infty$ y $\mu_J = +\infty$. Los umbrales $\mu_1 < \mu_2 < \cdots < \mu_{J-1}$ son parámetros a estimar junto con $\boldsymbol{\beta}$.

Las probabilidades de observar cada categoría son:

$$P(y_i = j) = F(\mu_j - \mathbf{x}_i'\boldsymbol{\beta}) - F(\mu_{j-1} - \mathbf{x}_i'\boldsymbol{\beta})$$

donde $F$ es la función de distribución acumulada: $\Phi$ (normal estándar) para el Probit Ordenado o la función logística para el Logit Ordenado.

Supuestos del modelo

Existencia de variable latente continua: Debe existir una propensión subyacente continua que genere las categorías observadas.
Orden de los umbrales: Los umbrales deben mantener el orden natural $\mu_1 < \mu_2 < \cdots < \mu_{J-1}$.
Distribución del error: Los errores siguen una distribución conocida (normal para Probit, logística para Logit) con varianza constante.
Exogeneidad: Los regresores no están correlacionados con el término de error.
Proporcionalidad: El efecto de cada regresor es proporcional a través de todas las categorías (parallel regression assumption).

Interpretación de efectos marginales

Un resultado fundamental es que el signo del coeficiente $\beta_k$ no determina necesariamente el signo del efecto marginal en las categorías intermedias. Un coeficiente positivo siempre reduce la probabilidad de la categoría más baja y aumenta la de la más alta, pero su efecto sobre las categorías intermedias puede ser positivo o negativo, dependiendo de la posición de la densidad respecto a los umbrales.

Modelos de elección ordenada

Especificación del modelo

Supuestos del modelo

Interpretación de efectos marginales

Parámetros de simulación

Estimaciones del modelo

Efectos marginales medios

Interpretación econométrica