Glance and Focus con Rinforzo per lo Screening Pan-Cancro
Glance and Focus Reinforcement for Pan-cancer Screening
January 27, 2026
Autori: Linshan Wu, Jiaxin Zhuang, Hao Chen
cs.AI
Abstract
Lo screening pan-tumorale su larga scala nelle scansioni TC rimane una sfida per i metodi di IA esistenti, principalmente a causa della difficoltà di localizzare diversi tipi di piccole lesioni in grandi volumi TC. L'estremo squilibrio tra primo piano e sfondo ostacola significativamente la capacità dei modelli di concentrarsi sulle regioni affette da patologia, mentre un'attenzione ridondante sulle regioni sane non solo diminuisce l'efficienza ma aumenta anche i falsi positivi. Ispirati dalla strategia diagnostica di "sguardo rapido" (glance) e "focus" dei radiologi, introduciamo GF-Screen, un framework di apprendimento per rinforzo Glance e Focus per lo screening pan-tumorale. GF-Screen utilizza un modello Glance per localizzare le regioni patologiche e un modello Focus per segmentare con precisione le lesioni, dove i risultati della segmentazione del modello Focus vengono utilizzati per premiare il modello Glance tramite Apprendimento per Rinforzo (RL). Nello specifico, il modello Glance ritaglia un gruppo di sotto-volumi dall'intero volume TC e impara a selezionare i sotto-volumi contenenti lesioni affinché il modello Focus li segmenti. Considerando che l'operazione di selezione non è differenziabile per l'addestramento alla segmentazione, proponiamo di utilizzare i risultati della segmentazione per premiare il modello Glance. Per ottimizzare il modello Glance, introduciamo un nuovo paradigma di apprendimento relativo di gruppo, che utilizza un confronto relativo di gruppo per dare priorità alle previsioni ad alto vantaggio e scartare quelle a basso vantaggio all'interno dei gruppi di sotto-volumi, migliorando non solo l'efficienza ma anche riducendo i falsi positivi. In questo modo, per la prima volta, estendiamo efficacemente le tecniche all'avanguardia di RL per affrontare le sfide specifiche dello screening pan-tumorale. Esperimenti estesi su 16 dataset interni e 7 esterni relativi a 9 tipi di lesione hanno dimostrato l'efficacia di GF-Screen. Degno di nota, GF-Screen guida la classifica di validazione pubblica della challenge pan-tumorale MICCAI FLARE25, superando di ampio margine la soluzione campione di FLARE24 (+25.6% DSC e +28.2% NSD).
English
Pan-cancer screening in large-scale CT scans remains challenging for existing AI methods, primarily due to the difficulty of localizing diverse types of tiny lesions in large CT volumes. The extreme foreground-background imbalance significantly hinders models from focusing on diseased regions, while redundant focus on healthy regions not only decreases the efficiency but also increases false positives. Inspired by radiologists' glance and focus diagnostic strategy, we introduce GF-Screen, a Glance and Focus reinforcement learning framework for pan-cancer screening. GF-Screen employs a Glance model to localize the diseased regions and a Focus model to precisely segment the lesions, where segmentation results of the Focus model are leveraged to reward the Glance model via Reinforcement Learning (RL). Specifically, the Glance model crops a group of sub-volumes from the entire CT volume and learns to select the sub-volumes with lesions for the Focus model to segment. Given that the selecting operation is non-differentiable for segmentation training, we propose to employ the segmentation results to reward the Glance model. To optimize the Glance model, we introduce a novel group relative learning paradigm, which employs group relative comparison to prioritize high-advantage predictions and discard low-advantage predictions within sub-volume groups, not only improving efficiency but also reducing false positives. In this way, for the first time, we effectively extend cutting-edge RL techniques to tackle the specific challenges in pan-cancer screening. Extensive experiments on 16 internal and 7 external datasets across 9 lesion types demonstrated the effectiveness of GF-Screen. Notably, GF-Screen leads the public validation leaderboard of MICCAI FLARE25 pan-cancer challenge, surpassing the FLARE24 champion solution by a large margin (+25.6% DSC and +28.2% NSD).