Comparación de funciones de enlace

Funciones de enlace en modelos de elección binaria

En los modelos de elección binaria, la variable dependiente $y_i$ solo puede tomar valores 0 o 1. Para garantizar que las probabilidades predichas estén siempre en el intervalo [0,1], necesitamos una función de enlace que transforme el índice lineal $\mathbf{x}_i'\boldsymbol{\beta}$ en una probabilidad válida.

La probabilidad de que $y_i = 1$ se modela como:

$$P(y_i = 1 \mid \mathbf{x}_i) = F(\mathbf{x}_i'\boldsymbol{\beta})$$

donde $F$ es una función de distribución acumulada (CDF) que garantiza $P \in [0,1]$. Las dos funciones de enlace más utilizadas son:

Modelo Probit (CDF Normal)

$$\Phi(z) = \int_{-\infty}^{z} \frac{1}{\sqrt{2\pi}} e^{-t^2/2} dt$$

donde $\Phi$ es la función de distribución acumulada de la normal estándar, $z = \mathbf{x}_i'\boldsymbol{\beta}$ es el índice lineal, y $t$ es la variable de integración.

Modelo Logit (CDF Logística)

$$\Lambda(z) = \frac{e^z}{1 + e^z} = \frac{1}{1 + e^{-z}}$$

donde $\Lambda$ es la función de distribución acumulada logística y $z = \mathbf{x}_i'\boldsymbol{\beta}$ es el índice lineal.

Supuestos de los modelos

Los errores siguen la distribución especificada: normal estándar (Probit) o logística estándar (Logit)
Las observaciones son independientes entre sí
No existe multicolinealidad perfecta entre los regresores
El modelo está correctamente especificado (no hay variables omitidas relevantes)
La relación entre el índice lineal y la probabilidad sigue la forma funcional especificada

La principal diferencia práctica entre ambos modelos radica en el comportamiento de las colas: la distribución normal tiene colas más ligeras que la logística, lo que implica que el Probit asigna probabilidades más bajas a eventos extremos cuando el índice lineal es muy positivo o muy negativo.

Funciones de enlace en modelos de elección binaria

Modelo Probit (CDF Normal)

Modelo Logit (CDF Logística)

Supuestos de los modelos

Parámetros de simulación

Comparación de probabilidades predichas

Estadísticas descriptivas

Interpretación econométrica