Refuerzo de Mirada y Enfoque para el Cribado Pan-Cáncer
Glance and Focus Reinforcement for Pan-cancer Screening
January 27, 2026
Autores: Linshan Wu, Jiaxin Zhuang, Hao Chen
cs.AI
Resumen
El cribado pan-cáncer en tomografías computarizadas a gran escala sigue siendo un desafío para los métodos de IA existentes, principalmente debido a la dificultad de localizar diversos tipos de lesiones diminutas en grandes volúmenes de TC. El extremo desequilibrio entre primer plano y fondo dificulta significativamente que los modelos se concentren en las regiones enfermas, mientras que la atención redundante en las regiones sanas no solo disminuye la eficiencia, sino que también aumenta los falsos positivos. Inspirados en la estrategia diagnóstica de vistazo y enfoque de los radiólogos, presentamos GF-Screen, un marco de aprendizaje por refuerzo de Vistazo y Enfoque para el cribado pan-cáncer. GF-Screen emplea un modelo de Vistazo para localizar las regiones enfermas y un modelo de Enfoque para segmentar con precisión las lesiones, donde los resultados de segmentación del modelo de Enfoque se utilizan para recompensar al modelo de Vistazo mediante Aprendizaje por Refuerzo (RL). Específicamente, el modelo de Vistazo recorta un grupo de subvolúmenes de todo el volumen de TC y aprende a seleccionar los subvolúmenes con lesiones para que el modelo de Enfoque los segmente. Dado que la operación de selección no es diferenciable para el entrenamiento de segmentación, proponemos emplear los resultados de segmentación para recompensar al modelo de Vistazo. Para optimizar el modelo de Vistazo, introducimos un novedoso paradigma de aprendizaje relativo grupal, que emplea una comparación relativa grupal para priorizar predicciones de alta ventaja y descartar predicciones de baja ventaja dentro de grupos de subvolúmenes, mejorando no solo la eficiencia sino también reduciendo los falsos positivos. De esta manera, por primera vez, extendemos eficazmente técnicas de vanguardia de RL para abordar los desafíos específicos del cribado pan-cáncer. Experimentos exhaustivos en 16 conjuntos de datos internos y 7 externos a través de 9 tipos de lesiones demostraron la efectividad de GF-Screen. Notablemente, GF-Screen lidera la tabla de clasificación de validación pública del desafío pan-cáncer MICCAI FLARE25, superando por un amplio margen a la solución campeona de FLARE24 (+25.6% DSC y +28.2% NSD).
English
Pan-cancer screening in large-scale CT scans remains challenging for existing AI methods, primarily due to the difficulty of localizing diverse types of tiny lesions in large CT volumes. The extreme foreground-background imbalance significantly hinders models from focusing on diseased regions, while redundant focus on healthy regions not only decreases the efficiency but also increases false positives. Inspired by radiologists' glance and focus diagnostic strategy, we introduce GF-Screen, a Glance and Focus reinforcement learning framework for pan-cancer screening. GF-Screen employs a Glance model to localize the diseased regions and a Focus model to precisely segment the lesions, where segmentation results of the Focus model are leveraged to reward the Glance model via Reinforcement Learning (RL). Specifically, the Glance model crops a group of sub-volumes from the entire CT volume and learns to select the sub-volumes with lesions for the Focus model to segment. Given that the selecting operation is non-differentiable for segmentation training, we propose to employ the segmentation results to reward the Glance model. To optimize the Glance model, we introduce a novel group relative learning paradigm, which employs group relative comparison to prioritize high-advantage predictions and discard low-advantage predictions within sub-volume groups, not only improving efficiency but also reducing false positives. In this way, for the first time, we effectively extend cutting-edge RL techniques to tackle the specific challenges in pan-cancer screening. Extensive experiments on 16 internal and 7 external datasets across 9 lesion types demonstrated the effectiveness of GF-Screen. Notably, GF-Screen leads the public validation leaderboard of MICCAI FLARE25 pan-cancer challenge, surpassing the FLARE24 champion solution by a large margin (+25.6% DSC and +28.2% NSD).