Los modelos de elección ordenada se utilizan cuando la variable dependiente es categórica con un orden natural. A diferencia de las variables nominales (como la elección entre medios de transporte), las variables ordinales tienen una jerarquía clara: satisfacción laboral (muy insatisfecho, insatisfecho, neutral, satisfecho, muy satisfecho), calificación crediticia (AAA, AA, A, BBB, BB, B), o nivel de acuerdo con una política (totalmente en desacuerdo a totalmente de acuerdo).
El modelo parte de una variable latente continua no observada que representa la propensión subyacente del individuo. Esta variable latente se transforma en categorías observables mediante umbrales que dividen el espacio continuo en regiones discretas.
La variable latente continua se especifica como:
donde \(y_i^*\) es la variable latente no observada, \(\mathbf{x}_i\) es el vector de regresores, \(\boldsymbol{\beta}\) es el vector de parámetros a estimar, y \(u_i\) es el término de error.
La variable observada \(y_i \in \{1, 2, \ldots, J\}\) se obtiene mediante umbrales:
con \(\mu_0 = -\infty\) y \(\mu_J = +\infty\). Los umbrales \(\mu_1 < \mu_2 < \cdots < \mu_{J-1}\) son parámetros a estimar junto con \(\boldsymbol{\beta}\).
Las probabilidades de observar cada categoría son:
donde \(F\) es la función de distribución acumulada: \(\Phi\) (normal estándar) para el Probit Ordenado o la función logística para el Logit Ordenado.
Un resultado fundamental es que el signo del coeficiente \(\beta_k\) no determina necesariamente el signo del efecto marginal en las categorías intermedias. Un coeficiente positivo siempre reduce la probabilidad de la categoría más baja y aumenta la de la más alta, pero su efecto sobre las categorías intermedias puede ser positivo o negativo, dependiendo de la posición de la densidad respecto a los umbrales.