SurvHTE-Bench: Бенчмарк для оценки гетерогенного эффекта лечения в анализе выживаемости

Аннотация

Оценка гетерогенных эффектов лечения (ГЭЛ) по правоцензурированным данным о выживаемости имеет критическое значение в высокорисковых областях, таких как прецизионная медицина и индивидуализированное принятие решений. Однако условия анализа выживаемости создают уникальные проблемы для оценки ГЭЛ из-за цензурирования, ненаблюдаемых контрфактических исходов и сложных предположений об идентифицируемости. Несмотря на недавние достижения — от Causual Survival Forests до мета-алгоритмов для анализа выживаемости и методов импутации исходов — практики оценки остаются фрагментированными и несогласованными. Мы представляем SurvHTE-Bench, первый комплексный эталонный набор для оценки ГЭЛ при цензурированных исходах. Этот набор включает: (i) модульный набор синтетических данных с известной истинной моделью, систематически варьирующий причинно-следственные предположения и динамику выживаемости; (ii) полусинтетические данные, сочетающие реальные ковариаты с смоделированными вмешательствами и исходами; и (iii) реальные данные из близнецового исследования (с известной истинной моделью) и из клинического испытания по ВИЧ. В синтетических, полусинтетических и реальных условиях мы проводим первое строгое сравнение методов оценки ГЭЛ для анализа выживаемости в разнообразных условиях и при нарушениях реалистичных предположений. SurvHTE-Bench закладывает основу для справедливой, воспроизводимой и расширяемой оценки причинно-следственных методов в анализе выживаемости. Данные и код нашего эталонного набора доступны по адресу: https://github.com/Shahriarnz14/SurvHTE-Bench.

English

Estimating heterogeneous treatment effects (HTEs) from right-censored survival data is critical in high-stakes applications such as precision medicine and individualized policy-making. Yet, the survival analysis setting poses unique challenges for HTE estimation due to censoring, unobserved counterfactuals, and complex identification assumptions. Despite recent advances, from Causal Survival Forests to survival meta-learners and outcome imputation approaches, evaluation practices remain fragmented and inconsistent. We introduce SurvHTE-Bench, the first comprehensive benchmark for HTE estimation with censored outcomes. The benchmark spans (i) a modular suite of synthetic datasets with known ground truth, systematically varying causal assumptions and survival dynamics, (ii) semi-synthetic datasets that pair real-world covariates with simulated treatments and outcomes, and (iii) real-world datasets from a twin study (with known ground truth) and from an HIV clinical trial. Across synthetic, semi-synthetic, and real-world settings, we provide the first rigorous comparison of survival HTE methods under diverse conditions and realistic assumption violations. SurvHTE-Bench establishes a foundation for fair, reproducible, and extensible evaluation of causal survival methods. The data and code of our benchmark are available at: https://github.com/Shahriarnz14/SurvHTE-Bench .

SurvHTE-Bench: Бенчмарк для оценки гетерогенного эффекта лечения в анализе выживаемости

SurvHTE-Bench: A Benchmark for Heterogeneous Treatment Effect Estimation in Survival Analysis

Аннотация

Support