Los modelos de recuento (Poisson y Binomial Negativa) se utilizan cuando la variable dependiente representa conteos de eventos: número de visitas al médico, accidentes laborales, publicaciones académicas, etc. Estos datos tienen características especiales que hacen inadecuada la regresión lineal ordinaria.
En el modelo de regresión de Poisson, la variable dependiente Y sigue una distribución de Poisson con parámetro λ que depende de las covariables:
$$\lambda_i = E[Y_i | \mathbf{x}_i] = e^{\mathbf{x}_i'\boldsymbol{\beta}}$$Donde λᵢ es la tasa esperada de ocurrencias para la observación i, 𝐱ᵢ es el vector de covariables, y β es el vector de coeficientes.
La Tasa de Incidencia (Incidence Rate Ratio, IRR) mide el efecto multiplicativo de una covariable sobre la tasa esperada de recuento:
$$\text{IRR}_j = \frac{E[Y | x_j+1]}{E[Y | x_j]} = \frac{e^{\mathbf{x}'\boldsymbol{\beta}+\beta_j}}{e^{\mathbf{x}'\boldsymbol{\beta}}} = e^{\beta_j}$$Donde IRRⱼ es la tasa de incidencia para la variable j, y βⱼ es su coeficiente estimado.
El Efecto Marginal Promedio expresa el cambio absoluto en el número esperado de eventos:
$$\text{AME}_j = \frac{1}{n}\sum_{i=1}^n \frac{\partial E[Y_i | \mathbf{x}_i]}{\partial x_j} = \frac{1}{n}\sum_{i=1}^n \hat{\lambda}_i \cdot \beta_j = \bar{\lambda} \cdot \beta_j$$Donde AMEⱼ es el efecto marginal promedio, λ̂ᵢ es la tasa esperada predicha, y λ̄ es la media de las tasas predichas.
Cuando hay sobredispersión (varianza > media), el modelo Binomial Negativa es más apropiado, pero las interpretaciones de IRR y AME se mantienen similares.