SurvHTE-Bench: Een Benchmark voor de Schatting van Heterogeen Behandelingseffect in Overlevingsanalyse
SurvHTE-Bench: A Benchmark for Heterogeneous Treatment Effect Estimation in Survival Analysis
March 5, 2026
Auteurs: Shahriar Noroozizadeh, Xiaobin Shen, Jeremy C. Weiss, George H. Chen
cs.AI
Samenvatting
Het schatten van heterogene behandelingseffecten (HTE's) uit rechts-gecensureerde overlevingsdata is cruciaal in hoog-risicotoepassingen zoals gepersonaliseerde geneeskunde en geïndividualiseerd beleid. Desalniettemin stelt de overlevingsanalyse-instelling unieke uitdagingen voor HTE-schatting vanwege censurering, niet-geobserveerde contrafeitelijke uitkomsten en complexe identificatie-aannames. Ondanks recente vooruitgang, van Causal Survival Forests tot survival meta-learners en outcome-imputatiebenaderingen, blijven evaluatiepraktijken gefragmenteerd en inconsistent. Wij introduceren SurvHTE-Bench, de eerste uitgebreide benchmark voor HTE-schatting met gecensureerde uitkomsten. De benchmark omvat (i) een modulaire reeks synthetische datasets met bekende grondwaarheid, die causale aannames en overlevingsdynamiek systematisch variëren, (ii) semi-synthetische datasets die real-world covariaten combineren met gesimuleerde behandelingen en uitkomsten, en (iii) real-world datasets uit een tweelingstudie (met bekende grondwaarheid) en uit een HIV-klinische trial. Over synthetische, semi-synthetische en real-world settings heen bieden wij de eerste rigoureuze vergelijking van survival HTE-methoden onder diverse condities en realistische schendingen van aannames. SurvHTE-Bench legt een fundament voor eerlijke, reproduceerbare en uitbreidbare evaluatie van causale overlevingsmethoden. De data en code van onze benchmark zijn beschikbaar op: https://github.com/Shahriarnz14/SurvHTE-Bench.
English
Estimating heterogeneous treatment effects (HTEs) from right-censored survival data is critical in high-stakes applications such as precision medicine and individualized policy-making. Yet, the survival analysis setting poses unique challenges for HTE estimation due to censoring, unobserved counterfactuals, and complex identification assumptions. Despite recent advances, from Causal Survival Forests to survival meta-learners and outcome imputation approaches, evaluation practices remain fragmented and inconsistent. We introduce SurvHTE-Bench, the first comprehensive benchmark for HTE estimation with censored outcomes. The benchmark spans (i) a modular suite of synthetic datasets with known ground truth, systematically varying causal assumptions and survival dynamics, (ii) semi-synthetic datasets that pair real-world covariates with simulated treatments and outcomes, and (iii) real-world datasets from a twin study (with known ground truth) and from an HIV clinical trial. Across synthetic, semi-synthetic, and real-world settings, we provide the first rigorous comparison of survival HTE methods under diverse conditions and realistic assumption violations. SurvHTE-Bench establishes a foundation for fair, reproducible, and extensible evaluation of causal survival methods. The data and code of our benchmark are available at: https://github.com/Shahriarnz14/SurvHTE-Bench .