医療世界モデル:治療計画のための腫瘍進化の生成的シミュレーション
Medical World Model: Generative Simulation of Tumor Evolution for Treatment Planning
June 2, 2025
著者: Yijun Yang, Zhao-Yang Wang, Qiuping Liu, Shuwen Sun, Kang Wang, Rama Chellappa, Zongwei Zhou, Alan Yuille, Lei Zhu, Yu-Dong Zhang, Jieneng Chen
cs.AI
要旨
効果的な治療の提供と情報に基づいた臨床意思決定は、現代医学と臨床ケアにおける重要な目標である。我々は、大規模生成モデルの最近の進展を活用し、臨床意思決定のための疾患ダイナミクスのシミュレーションに興味を持っている。この目的のために、我々は医学分野で初めてのワールドモデルであるMedical World Model (MeWM)を紹介する。MeWMは、臨床決定に基づいて将来の疾患状態を視覚的に予測するものである。MeWMは、(i) ポリシーモデルとして機能する視覚言語モデルと、(ii) ダイナミクスモデルとしての腫瘍生成モデルで構成される。ポリシーモデルは、臨床治療などのアクションプランを生成し、ダイナミクスモデルは与えられた治療条件下での腫瘍の進行または退縮をシミュレートする。これに基づいて、我々はシミュレーションされた治療後の腫瘍に生存分析を適用する逆ダイナミクスモデルを提案し、治療効果の評価と最適な臨床アクションプランの選択を可能にする。その結果、提案されたMeWMは、治療後の腫瘍を合成することで疾患ダイナミクスをシミュレートし、放射線科医によるチューリングテストで最先端の特異性を達成した。同時に、その逆ダイナミクスモデルは、すべての指標において医学専門のGPTを上回り、個別化された治療プロトコルの最適化において優れた性能を示した。特に、MeWMは介入医師の臨床意思決定を改善し、最適なTACEプロトコルを選択する際のF1スコアを13%向上させ、医学ワールドモデルをセカンドリーダーとして将来統合する道を開いた。
English
Providing effective treatment and making informed clinical decisions are
essential goals of modern medicine and clinical care. We are interested in
simulating disease dynamics for clinical decision-making, leveraging recent
advances in large generative models. To this end, we introduce the Medical
World Model (MeWM), the first world model in medicine that visually predicts
future disease states based on clinical decisions. MeWM comprises (i)
vision-language models to serve as policy models, and (ii) tumor generative
models as dynamics models. The policy model generates action plans, such as
clinical treatments, while the dynamics model simulates tumor progression or
regression under given treatment conditions. Building on this, we propose the
inverse dynamics model that applies survival analysis to the simulated
post-treatment tumor, enabling the evaluation of treatment efficacy and the
selection of the optimal clinical action plan. As a result, the proposed MeWM
simulates disease dynamics by synthesizing post-treatment tumors, with
state-of-the-art specificity in Turing tests evaluated by radiologists.
Simultaneously, its inverse dynamics model outperforms medical-specialized GPTs
in optimizing individualized treatment protocols across all metrics. Notably,
MeWM improves clinical decision-making for interventional physicians, boosting
F1-score in selecting the optimal TACE protocol by 13%, paving the way for
future integration of medical world models as the second readers.