Logit multinomial y probabilidades de elección

Modelo Logit Multinomial

El modelo Logit Multinomial permite analizar decisiones de elección entre múltiples alternativas mutuamente excluyentes. A diferencia del modelo logit binario, que se limita a dos opciones (sí/no, comprar/no comprar), el logit multinomial puede manejar tres o más alternativas: un consumidor que elige entre coche, autobús o tren; un trabajador que decide entre empleo, desempleo o inactividad; o una empresa que selecciona entre diferentes estrategias de inversión.

El modelo se basa en la teoría de utilidad aleatoria de McFadden. Cada individuo i evalúa la utilidad que le proporciona cada alternativa j según sus características observables y un componente aleatorio no observado. La utilidad de la alternativa j para el individuo i se expresa como:

$$U_{ij} = \mathbf{x}_i'\boldsymbol{\beta}_j + \varepsilon_{ij}$$

donde $\mathbf{x}_i$ es el vector de características del individuo i, $\boldsymbol{\beta}_j$ son los parámetros específicos de la alternativa j, y $\varepsilon_{ij}$ es el término de error aleatorio. El individuo elige la alternativa que maximiza su utilidad.

Si los errores $\varepsilon_{ij}$ siguen independientemente una distribución Gumbel (valor extremo tipo I), las probabilidades de elección toman la forma logística multinomial:

$$P(y_i = j) = \frac{\exp(\mathbf{x}_i'\boldsymbol{\beta}_j)}{\sum_{k=1}^J \exp(\mathbf{x}_i'\boldsymbol{\beta}_k)}$$

donde J es el número total de alternativas. Para identificar el modelo, se normaliza una categoría como base fijando $\boldsymbol{\beta}_1 = \mathbf{0}$. Los coeficientes del resto de alternativas se interpretan como log-odds relativos a la categoría base:

$$\ln\frac{P(y=j)}{P(y=1)} = \mathbf{x}'\boldsymbol{\beta}_j$$

Supuestos del modelo

Independencia de Alternativas Irrelevantes (IIA): El ratio de probabilidades entre dos alternativas cualesquiera no depende de la existencia o características de otras alternativas. Este supuesto es restrictivo y puede ser problemático cuando existen alternativas muy similares entre sí.
Distribución Gumbel de los errores: Los términos de error siguen una distribución de valor extremo tipo I, lo que genera la forma funcional logística de las probabilidades.
Independencia entre individuos: Las decisiones de diferentes individuos son independientes entre sí.
Ausencia de multicolinealidad perfecta: Las variables explicativas no deben estar perfectamente correlacionadas.
Muestra suficientemente grande: Para que las propiedades asintóticas de los estimadores de máxima verosimilitud se cumplan.

La interpretación de los coeficientes requiere cuidado especial. Un coeficiente positivo de $x_k$ en la ecuación de la alternativa j indica que un aumento de $x_k$ incrementa la probabilidad relativa de elegir j respecto a la categoría base. Sin embargo, esto no implica necesariamente que aumente la probabilidad absoluta de j, ya que depende del efecto sobre todas las demás alternativas.

Modelo Logit Multinomial

Supuestos del modelo

Parámetros del modelo

Coeficientes para Autobús (vs Coche)

Coeficientes para Tren (vs Coche)

Coeficientes estimados

Efectos marginales medios

Probabilidades predichas por perfil

Interpretación econométrica