En los modelos de elección binaria, la variable dependiente \(y_i\) solo puede tomar valores 0 o 1. Para garantizar que las probabilidades predichas estén siempre en el intervalo [0,1], necesitamos una función de enlace que transforme el índice lineal \(\mathbf{x}_i'\boldsymbol{\beta}\) en una probabilidad válida.
La probabilidad de que \(y_i = 1\) se modela como:
donde \(F\) es una función de distribución acumulada (CDF) que garantiza \(P \in [0,1]\). Las dos funciones de enlace más utilizadas son:
donde \(\Phi\) es la función de distribución acumulada de la normal estándar, \(z = \mathbf{x}_i'\boldsymbol{\beta}\) es el índice lineal, y \(t\) es la variable de integración.
donde \(\Lambda\) es la función de distribución acumulada logística y \(z = \mathbf{x}_i'\boldsymbol{\beta}\) es el índice lineal.
La principal diferencia práctica entre ambos modelos radica en el comportamiento de las colas: la distribución normal tiene colas más ligeras que la logística, lo que implica que el Probit asigna probabilidades más bajas a eventos extremos cuando el índice lineal es muy positivo o muy negativo.