ChatPaper.aiChatPaper

SurvHTE-Bench:生存分析における不均一治療効果推定のためのベンチマーク

SurvHTE-Bench: A Benchmark for Heterogeneous Treatment Effect Estimation in Survival Analysis

March 5, 2026
著者: Shahriar Noroozizadeh, Xiaobin Shen, Jeremy C. Weiss, George H. Chen
cs.AI

要旨

右側打ち切りの生存データから異質な治療効果(HTE)を推定することは、精密医療や個別化された政策決定などの高リスク応用において極めて重要である。しかし、生存分析の設定では、打ち切り、観測不能な反事実、複雑な識別仮定により、HTE推定に特有の課題が生じる。Causal Survival Forestsから生存メタラーナーや結果代入アプローチに至る最近の進展にもかかわらず、評価手法は断片的で一貫性に欠けている。本研究では、打ち切り結果を伴うHTE推定のための初の包括的ベンチマークであるSurvHTE-Benchを提案する。このベンチマークは、(i) 既知の真実値を持つ合成データセットのモジュール式スイート(因果仮説と生存ダイナミクスを体系的に変化)、(ii) 実世界の共変量と模擬的な治療・結果を組み合わせた半合成データセット、(iii) 双子研究(既知の真実値あり)およびHIV臨床試験に基づく実世界データセットを含む。合成、半合成、実世界の設定全体において、多様な条件下および現実的な仮定違反下での生存HTE手法の初の厳密な比較を提供する。SurvHTE-Benchは、因果生存手法の公平で再現性が高く拡張可能な評価の基盤を確立する。ベンチマークのデータとコードは以下で利用可能である:https://github.com/Shahriarnz14/SurvHTE-Bench
English
Estimating heterogeneous treatment effects (HTEs) from right-censored survival data is critical in high-stakes applications such as precision medicine and individualized policy-making. Yet, the survival analysis setting poses unique challenges for HTE estimation due to censoring, unobserved counterfactuals, and complex identification assumptions. Despite recent advances, from Causal Survival Forests to survival meta-learners and outcome imputation approaches, evaluation practices remain fragmented and inconsistent. We introduce SurvHTE-Bench, the first comprehensive benchmark for HTE estimation with censored outcomes. The benchmark spans (i) a modular suite of synthetic datasets with known ground truth, systematically varying causal assumptions and survival dynamics, (ii) semi-synthetic datasets that pair real-world covariates with simulated treatments and outcomes, and (iii) real-world datasets from a twin study (with known ground truth) and from an HIV clinical trial. Across synthetic, semi-synthetic, and real-world settings, we provide the first rigorous comparison of survival HTE methods under diverse conditions and realistic assumption violations. SurvHTE-Bench establishes a foundation for fair, reproducible, and extensible evaluation of causal survival methods. The data and code of our benchmark are available at: https://github.com/Shahriarnz14/SurvHTE-Bench .
PDF22March 15, 2026