SurvHTE-Bench : Un Référentiel pour l'Estimation de l'Effet du Traitement Hétérogène en Analyse de Survie
SurvHTE-Bench: A Benchmark for Heterogeneous Treatment Effect Estimation in Survival Analysis
March 5, 2026
Auteurs: Shahriar Noroozizadeh, Xiaobin Shen, Jeremy C. Weiss, George H. Chen
cs.AI
Résumé
L'estimation des effets de traitement hétérogènes (ETH) à partir de données de survie censurées à droite est cruciale dans des applications à haut risque telles que la médecine de précision et l'élaboration de politiques individualisées. Cependant, le cadre de l'analyse de survie pose des défis uniques pour l'estimation des ETH en raison de la censure, des contrefactuels non observés et des hypothèses d'identification complexes. Malgré des progrès récents, allant des Forêts de Survie Causales aux méta-apprenants de survie et aux approches par imputation des résultats, les pratiques d'évaluation restent fragmentées et incohérentes. Nous présentons SurvHTE-Bench, le premier benchmark complet pour l'estimation des ETH avec des résultats censurés. Ce benchmark couvre (i) une suite modulaire d'ensembles de données synthétiques avec une vérité terrain connue, faisant systématiquement varier les hypothèses causales et la dynamique de survie, (ii) des ensembles de données semi-synthétiques qui associent des covariables du monde réel à des traitements et des résultats simulés, et (iii) des ensembles de données réels provenant d'une étude sur des jumeaux (avec une vérité terrain connue) et d'un essai clinique sur le VIH. Dans des contextes synthétiques, semi-synthétiques et réels, nous fournissons la première comparaison rigoureuse des méthodes d'estimation des ETH en survie dans diverses conditions et sous des violations réalistes des hypothèses. SurvHTE-Bench établit une base pour une évaluation équitable, reproductible et extensible des méthodes de survie causale. Les données et le code de notre benchmark sont disponibles à l'adresse : https://github.com/Shahriarnz14/SurvHTE-Bench.
English
Estimating heterogeneous treatment effects (HTEs) from right-censored survival data is critical in high-stakes applications such as precision medicine and individualized policy-making. Yet, the survival analysis setting poses unique challenges for HTE estimation due to censoring, unobserved counterfactuals, and complex identification assumptions. Despite recent advances, from Causal Survival Forests to survival meta-learners and outcome imputation approaches, evaluation practices remain fragmented and inconsistent. We introduce SurvHTE-Bench, the first comprehensive benchmark for HTE estimation with censored outcomes. The benchmark spans (i) a modular suite of synthetic datasets with known ground truth, systematically varying causal assumptions and survival dynamics, (ii) semi-synthetic datasets that pair real-world covariates with simulated treatments and outcomes, and (iii) real-world datasets from a twin study (with known ground truth) and from an HIV clinical trial. Across synthetic, semi-synthetic, and real-world settings, we provide the first rigorous comparison of survival HTE methods under diverse conditions and realistic assumption violations. SurvHTE-Bench establishes a foundation for fair, reproducible, and extensible evaluation of causal survival methods. The data and code of our benchmark are available at: https://github.com/Shahriarnz14/SurvHTE-Bench .