Distribución Bernoulli y Binomial
  • Teoría
  • Simulación Interactiva
  • Resultados e Interpretación

Distribuciones Bernoulli y Binomial

La Distribución de Bernoulli

Una variable aleatoria sigue una distribución Bernoulli cuando solo puede tomar dos valores: 1 (éxito) con probabilidad p, y 0 (fracaso) con probabilidad 1-p. Esta distribución modela experimentos con resultados binarios como trabajar/no trabajar, comprar/no comprar, o aprobar/suspender un examen.

La función de masa de probabilidad de una Bernoulli(p) es:

$$f(y; p) = p^y (1-p)^{1-y}, \quad y \in \{0, 1\}$$

donde y es el resultado observado (0 o 1) y p es el parámetro de probabilidad de éxito.

Los momentos de la distribución Bernoulli son:

$$E(Y) = p$$
$$\text{Var}(Y) = p(1-p)$$

Un aspecto fundamental es que la varianza depende del parámetro p, alcanzando su máximo cuando p = 0.5. Esta característica implica heterocedasticidad inherente cuando p varía entre individuos, lo que viola los supuestos del modelo lineal clásico.

La Distribución Binomial

La distribución Binomial surge cuando realizamos n experimentos Bernoulli independientes, cada uno con la misma probabilidad de éxito p. La variable aleatoria X cuenta el número total de éxitos en los n ensayos.

La función de masa de probabilidad de una Binomial(n, p) es:

$$P(X = k) = \binom{n}{k} p^k (1-p)^{n-k}, \quad k = 0, 1, 2, \ldots, n$$

donde k es el número de éxitos observados, n es el número de ensayos, y \(\binom{n}{k} = \frac{n!}{k!(n-k)!}\) es el coeficiente binomial.

Los momentos de la distribución Binomial son:

$$E(X) = np$$
$$\text{Var}(X) = np(1-p)$$

Supuestos de las Distribuciones

  1. Independencia: En la Binomial, cada ensayo debe ser independiente de los demás. La probabilidad de éxito en un ensayo no debe verse afectada por los resultados de ensayos anteriores.
  2. Probabilidad constante: La probabilidad de éxito p debe permanecer constante a lo largo de todos los ensayos.
  3. Número fijo de ensayos: En la Binomial, el número de ensayos n debe estar determinado de antemano.
  4. Resultado binario: Cada ensayo debe tener exactamente dos resultados posibles: éxito o fracaso.

Relevancia en Econometría

Estas distribuciones son fundamentales para entender por qué el modelo lineal de probabilidad (MCO aplicado a variables binarias) es problemático. La heterocedasticidad inherente de la Bernoulli hace que los errores estándar de MCO sean incorrectos, y las predicciones pueden salir del intervalo [0,1]. Los modelos Probit y Logit resuelven estos problemas utilizando funciones de distribución acumulada que garantizan predicciones válidas como probabilidades.

Parámetros de Simulación

Análisis de Resultados

Estadísticos Teóricos vs Empíricos

Propiedades de las Distribuciones

Interpretación Econométrica