Repenser l'interprétation des images CT du corps entier : une approche centrée sur les anomalies
Rethinking Whole-Body CT Image Interpretation: An Abnormality-Centric Approach
June 3, 2025
Auteurs: Ziheng Zhao, Lisong Dai, Ya Zhang, Yanfeng Wang, Weidi Xie
cs.AI
Résumé
L'interprétation automatisée des images tomodensitométriques (CT) – en particulier la localisation et la description des anomalies à travers des scans multi-plans et corporels entiers – reste un défi majeur en radiologie clinique. Ce travail vise à relever ce défi à travers quatre contributions clés : (i) Sur le plan taxonomique, nous collaborons avec des radiologues seniors pour proposer un système de classification hiérarchique complet, comprenant 404 anomalies représentatives couvrant toutes les régions du corps ; (ii) Concernant les données, nous contribuons à un ensemble de données contenant plus de 14,5K images CT issues de multiples plans et de toutes les régions du corps humain, et fournissons méticuleusement des annotations de référence pour plus de 19K anomalies, chacune liée à une description détaillée et intégrée dans la taxonomie ; (iii) En matière de développement de modèles, nous proposons OminiAbnorm-CT, capable de localiser et de décrire automatiquement les anomalies sur des images CT multi-plans et corporelles entières en réponse à des requêtes textuelles, tout en permettant une interaction flexible via des invites visuelles ; (iv) En ce qui concerne les benchmarks, nous établissons trois tâches d'évaluation représentatives basées sur des scénarios cliniques réels. À travers des expériences approfondies, nous démontrons qu'OminiAbnorm-CT surpasse significativement les méthodes existantes sur toutes les tâches et métriques.
English
Automated interpretation of CT images-particularly localizing and describing
abnormal findings across multi-plane and whole-body scans-remains a significant
challenge in clinical radiology. This work aims to address this challenge
through four key contributions: (i) On taxonomy, we collaborate with senior
radiologists to propose a comprehensive hierarchical classification system,
with 404 representative abnormal findings across all body regions; (ii) On
data, we contribute a dataset containing over 14.5K CT images from multiple
planes and all human body regions, and meticulously provide grounding
annotations for over 19K abnormalities, each linked to the detailed description
and cast into the taxonomy; (iii) On model development, we propose
OminiAbnorm-CT, which can automatically ground and describe abnormal findings
on multi-plane and whole-body CT images based on text queries, while also
allowing flexible interaction through visual prompts; (iv) On benchmarks, we
establish three representative evaluation tasks based on real clinical
scenarios. Through extensive experiments, we show that OminiAbnorm-CT can
significantly outperform existing methods on all the tasks and metrics.