SurvHTE-Bench: Un Punto de Referencia para la Estimación de Efectos Heterogéneos del Tratamiento en Análisis de Supervivencia
SurvHTE-Bench: A Benchmark for Heterogeneous Treatment Effect Estimation in Survival Analysis
March 5, 2026
Autores: Shahriar Noroozizadeh, Xiaobin Shen, Jeremy C. Weiss, George H. Chen
cs.AI
Resumen
La estimación de efectos de tratamiento heterogéneos (ETH) a partir de datos de supervivencia censurados por la derecha es fundamental en aplicaciones de alto impacto como la medicina de precisión y la formulación de políticas individualizadas. Sin embargo, el entorno del análisis de supervivencia plantea desafíos únicos para la estimación de ETH debido al censurado, los contrafactuales no observados y las complejas suposiciones de identificación. A pesar de los avances recientes, desde Bosques de Supervivencia Causal hasta meta-aprendices de supervivencia y enfoques de imputación de resultados, las prácticas de evaluación siguen siendo fragmentadas e inconsistentes. Presentamos SurvHTE-Bench, el primer benchmark integral para la estimación de ETH con resultados censurados. El benchmark abarca (i) un conjunto modular de conjuntos de datos sintéticos con verdad fundamental conocida, que varía sistemáticamente las suposiciones causales y las dinámicas de supervivencia, (ii) conjuntos de datos semi-sintéticos que combinan covariables del mundo real con tratamientos y resultados simulados, y (iii) conjuntos de datos del mundo real procedentes de un estudio de gemelos (con verdad fundamental conocida) y de un ensayo clínico sobre el VIH. A través de entornos sintéticos, semi-sintéticos y del mundo real, proporcionamos la primera comparación rigurosa de métodos de ETH en supervivencia bajo diversas condiciones y violaciones realistas de las suposiciones. SurvHTE-Bench establece una base para una evaluación justa, reproducible y extensible de los métodos de supervivencia causal. Los datos y el código de nuestro benchmark están disponibles en: https://github.com/Shahriarnz14/SurvHTE-Bench.
English
Estimating heterogeneous treatment effects (HTEs) from right-censored survival data is critical in high-stakes applications such as precision medicine and individualized policy-making. Yet, the survival analysis setting poses unique challenges for HTE estimation due to censoring, unobserved counterfactuals, and complex identification assumptions. Despite recent advances, from Causal Survival Forests to survival meta-learners and outcome imputation approaches, evaluation practices remain fragmented and inconsistent. We introduce SurvHTE-Bench, the first comprehensive benchmark for HTE estimation with censored outcomes. The benchmark spans (i) a modular suite of synthetic datasets with known ground truth, systematically varying causal assumptions and survival dynamics, (ii) semi-synthetic datasets that pair real-world covariates with simulated treatments and outcomes, and (iii) real-world datasets from a twin study (with known ground truth) and from an HIV clinical trial. Across synthetic, semi-synthetic, and real-world settings, we provide the first rigorous comparison of survival HTE methods under diverse conditions and realistic assumption violations. SurvHTE-Bench establishes a foundation for fair, reproducible, and extensible evaluation of causal survival methods. The data and code of our benchmark are available at: https://github.com/Shahriarnz14/SurvHTE-Bench .