ChatPaper.aiChatPaper

범암종 검진을 위한 일견 및 초점 강화 학습

Glance and Focus Reinforcement for Pan-cancer Screening

January 27, 2026
저자: Linshan Wu, Jiaxin Zhuang, Hao Chen
cs.AI

초록

대규모 CT 영상에서의 범암종 스크리닝은 방대한 CT 볼륨 내 다양한 유형의 미세 병변의 위치를 특정하기 어렵기 때문에 기존 AI 방법론들에게 여전히 과제로 남아 있습니다. 극단적인 전경-배경 불균형은 모델이 병변 영역에 집중하는 것을 크게 저해하며, 건강한 영역에 대한 불필요한 집중은 효율성을 저하할 뿐만 아니라 위양성률을 증가시킵니다. 우리는 방사선 전문의의 '휘익 검토(Glance)'와 '집중 분석(Focus)' 진단 전략에서 영감을 받아 범암종 스크리닝을 위한 GF-Screen(Glance and Focus reinforcement learning framework)을 제안합니다. GF-Screen은 병변 영역을 위치 특정하는 Glance 모델과 병변을 정밀하게 분할하는 Focus 모델을 활용하며, 강화 학습(Reinforcement Learning, RL)을 통해 Focus 모델의 분할 결과가 Glance 모델의 보상으로 사용됩니다. 구체적으로, Glance 모델은 전체 CT 볼륨에서 여러 개의 부분 볼륨을 추출하고, Focus 모델이 분할할 병변 포함 부분 볼륨을 선택하도록 학습합니다. 선택 작업 자체는 분할 학습에 대해 미분이 불가능하므로, 우리는 분할 결과를 이용해 Glance 모델에 보상을 제공하는 방식을 제안합니다. Glance 모델을 최적화하기 위해, 우리는 새로운 그룹 상대 학습 패러다임을 도입했습니다. 이는 부분 볼륨 그룹 내에서 높은 이점(advantage)을 가진 예측을 우선시하고 낮은 이점을 가진 예측을 제거하는 그룹 상대 비교를 사용하여 효율성을 향상시키고 위양성률을 줄입니다. 이러한 방식을 통해, 우리는 최첨단 강화 학습 기술을 범암종 스크리닝의 특정 과제 해결에 효과적으로 확장했습니다. 9가지 병변 유형에 걸친 16개의 내부 및 7개의 외부 데이터셋에서 수행한 폭넓은 실험을 통해 GF-Screen의 효과성을 입증했습니다. 특히, GF-Screen은 MICCAI FLARE25 범암종 챌린지의 공개 검증 리더보드에서 FLARE24 우승 솔루션을 큰 차이로(+25.6% DSC, +28.2% NSD) 제치고 선두를 달리고 있습니다.
English
Pan-cancer screening in large-scale CT scans remains challenging for existing AI methods, primarily due to the difficulty of localizing diverse types of tiny lesions in large CT volumes. The extreme foreground-background imbalance significantly hinders models from focusing on diseased regions, while redundant focus on healthy regions not only decreases the efficiency but also increases false positives. Inspired by radiologists' glance and focus diagnostic strategy, we introduce GF-Screen, a Glance and Focus reinforcement learning framework for pan-cancer screening. GF-Screen employs a Glance model to localize the diseased regions and a Focus model to precisely segment the lesions, where segmentation results of the Focus model are leveraged to reward the Glance model via Reinforcement Learning (RL). Specifically, the Glance model crops a group of sub-volumes from the entire CT volume and learns to select the sub-volumes with lesions for the Focus model to segment. Given that the selecting operation is non-differentiable for segmentation training, we propose to employ the segmentation results to reward the Glance model. To optimize the Glance model, we introduce a novel group relative learning paradigm, which employs group relative comparison to prioritize high-advantage predictions and discard low-advantage predictions within sub-volume groups, not only improving efficiency but also reducing false positives. In this way, for the first time, we effectively extend cutting-edge RL techniques to tackle the specific challenges in pan-cancer screening. Extensive experiments on 16 internal and 7 external datasets across 9 lesion types demonstrated the effectiveness of GF-Screen. Notably, GF-Screen leads the public validation leaderboard of MICCAI FLARE25 pan-cancer challenge, surpassing the FLARE24 champion solution by a large margin (+25.6% DSC and +28.2% NSD).
PDF41February 5, 2026