SurvHTE-Bench: 생존 분석에서의 이질적 처리 효과 추정을 위한 벤치마크
SurvHTE-Bench: A Benchmark for Heterogeneous Treatment Effect Estimation in Survival Analysis
March 5, 2026
저자: Shahriar Noroozizadeh, Xiaobin Shen, Jeremy C. Weiss, George H. Chen
cs.AI
초록
우측 중도 절단(right-censoring)된 생존 데이터에서 이질적 처리 효과(HTE)를 추정하는 것은 정밀의학 및 맞춤형 정책 결정과 같은 고위험 적용 분야에서 매우 중요합니다. 그러나 생존 분석 환경은 중도 절단, 관찰되지 않은 반사실적 결과, 그리고 복잡한 식별 가정으로 인해 HTE 추정에 독특한 과제를 제기합니다. Causal Survival Forests부터 생존 메타 학습기(survival meta-learners) 및 결과 대체(outcome imputation) 접근법에 이르기까지 최근 발전이 있었음에도 불구하고, 평가 관행은 여전히 파편화되고 일관성이 부족한 상태입니다. 본 연구는 중도 절단된 결과변수를 대상으로 HTE 추정을 위한 최초의 포괄적인 벤치마크인 SurvHTE-Bench를 소개합니다. 이 벤치마크는 (i) 실제 참값(ground truth)을 알고 있는 모듈식 합성 데이터셋 모음(인과관계 가정과 생존 역학을 체계적으로 변화시킴), (ii) 실제 세계의 공변량과 모의 처리 및 결과를 결합한 반-합성(semi-synthetic) 데이터셋, 그리고 (iii) 쌍둥이 연구(실제 참값을 가짐) 및 HIV 임상 시험에서 얻은 실제 데이터셋을 아우릅니다. 합성, 반-합성, 실제 세계 환경 전반에 걸쳐, 우리는 다양한 조건과 현실적인 가정 위반 하에서 생존 HTE 방법들에 대한 최초의 엄밀한 비교를 제공합니다. SurvHTE-Bench는 인과관계 생존 방법에 대한 공정하고 재현 가능하며 확장 가능한 평가의 기초를 마련합니다. 본 벤치마크의 데이터와 코드는 https://github.com/Shahriarnz14/SurvHTE-Bench 에서 이용할 수 있습니다.
English
Estimating heterogeneous treatment effects (HTEs) from right-censored survival data is critical in high-stakes applications such as precision medicine and individualized policy-making. Yet, the survival analysis setting poses unique challenges for HTE estimation due to censoring, unobserved counterfactuals, and complex identification assumptions. Despite recent advances, from Causal Survival Forests to survival meta-learners and outcome imputation approaches, evaluation practices remain fragmented and inconsistent. We introduce SurvHTE-Bench, the first comprehensive benchmark for HTE estimation with censored outcomes. The benchmark spans (i) a modular suite of synthetic datasets with known ground truth, systematically varying causal assumptions and survival dynamics, (ii) semi-synthetic datasets that pair real-world covariates with simulated treatments and outcomes, and (iii) real-world datasets from a twin study (with known ground truth) and from an HIV clinical trial. Across synthetic, semi-synthetic, and real-world settings, we provide the first rigorous comparison of survival HTE methods under diverse conditions and realistic assumption violations. SurvHTE-Bench establishes a foundation for fair, reproducible, and extensible evaluation of causal survival methods. The data and code of our benchmark are available at: https://github.com/Shahriarnz14/SurvHTE-Bench .