El estimador de Kaplan-Meier es un método no paramétrico para estimar la función de supervivencia S(t) en presencia de observaciones censuradas. A diferencia de los métodos paramétricos que asumen una distribución específica para los tiempos de duración, Kaplan-Meier permite que los datos hablen por sí mismos sin imponer restricciones distribucionales.
La función de supervivencia mide la probabilidad de que un individuo sobreviva (no experimente el evento de interés) más allá del tiempo t. En el contexto económico, esto puede referirse a la probabilidad de que un desempleado siga sin encontrar trabajo después de t meses, o que una empresa sobreviva más de t años desde su fundación.
$$\hat{S}(t) = \prod_{t_j \leq t} \left(1 - \frac{d_j}{n_j}\right)$$
Donde:
El estimador se construye de forma iterativa. En cada tiempo de evento \(t_j\), calculamos la probabilidad condicional de supervivencia como \((1 - d_j/n_j)\), que representa la fracción de individuos en riesgo que no experimentan el evento en ese momento. La función de supervivencia estimada es el producto acumulado de estas probabilidades condicionales.
Las observaciones censuradas contribuyen de manera crucial al estimador: forman parte del conjunto en riesgo \(n_j\) hasta el momento de su censura, pero no contribuyen eventos \(d_j\). Esto permite aprovechar la información parcial que proporcionan: sabemos que sobrevivieron al menos hasta el tiempo de censura.
Estos supuestos son fundamentales para la validez del estimador. La violación del supuesto de censura no informativa es particularmente problemática en aplicaciones económicas, donde la decisión de salir del estudio puede estar relacionada con variables no observadas que también afectan la duración.