SurvHTE-Bench: Un Benchmark per la Stima degli Effetti Eterogenei del Trattamento nell'Analisi di Sopravvivenza
SurvHTE-Bench: A Benchmark for Heterogeneous Treatment Effect Estimation in Survival Analysis
March 5, 2026
Autori: Shahriar Noroozizadeh, Xiaobin Shen, Jeremy C. Weiss, George H. Chen
cs.AI
Abstract
La stima degli effetti eterogenei del trattamento (HTE) da dati di sopravvivenza right-censored è fondamentale in applicazioni ad alto rischio come la medicina di precisione e la definizione di politiche individualizzate. Tuttavia, l'ambito dell'analisi di sopravvivenza presenta sfide uniche per la stima degli HTE a causa della censura, dei controfattuali non osservati e delle complesse assunzioni di identificazione. Nonostante i recenti progressi, dalle Causal Survival Forests ai survival meta-learner e agli approcci di imputazione degli outcome, le pratiche di valutazione rimangono frammentate e incoerenti. Introduciamo SurvHTE-Bench, il primo benchmark completo per la stima degli HTE con outcome censurati. Il benchmark comprende (i) una suite modulare di dataset sintetici con ground truth noto, che varia sistematicamente le assunzioni causali e le dinamiche di sopravvivenza, (ii) dataset semi-sintetici che abbinano covariate del mondo reale a trattamenti ed outcome simulati, e (iii) dataset del mondo reale provenienti da uno studio su gemelli (con ground truth noto) e da una sperimentazione clinica sull'HIV. In contesti sintetici, semi-sintetici e del mondo reale, forniamo il primo confronto rigoroso dei metodi per gli HTE in ambito survival sotto diverse condizioni e con violazioni realistiche delle assunzioni. SurvHTE-Bench stabilisce una base per una valutazione equa, riproducibile ed estensibile dei metodi causali in ambito survival. I dati e il codice del nostro benchmark sono disponibili al seguente indirizzo: https://github.com/Shahriarnz14/SurvHTE-Bench.
English
Estimating heterogeneous treatment effects (HTEs) from right-censored survival data is critical in high-stakes applications such as precision medicine and individualized policy-making. Yet, the survival analysis setting poses unique challenges for HTE estimation due to censoring, unobserved counterfactuals, and complex identification assumptions. Despite recent advances, from Causal Survival Forests to survival meta-learners and outcome imputation approaches, evaluation practices remain fragmented and inconsistent. We introduce SurvHTE-Bench, the first comprehensive benchmark for HTE estimation with censored outcomes. The benchmark spans (i) a modular suite of synthetic datasets with known ground truth, systematically varying causal assumptions and survival dynamics, (ii) semi-synthetic datasets that pair real-world covariates with simulated treatments and outcomes, and (iii) real-world datasets from a twin study (with known ground truth) and from an HIV clinical trial. Across synthetic, semi-synthetic, and real-world settings, we provide the first rigorous comparison of survival HTE methods under diverse conditions and realistic assumption violations. SurvHTE-Bench establishes a foundation for fair, reproducible, and extensible evaluation of causal survival methods. The data and code of our benchmark are available at: https://github.com/Shahriarnz14/SurvHTE-Bench .