Neubewertung der Ganzkörper-CT-Bildinterpretation: Ein abnormitätszentrierter Ansatz
Rethinking Whole-Body CT Image Interpretation: An Abnormality-Centric Approach
June 3, 2025
Autoren: Ziheng Zhao, Lisong Dai, Ya Zhang, Yanfeng Wang, Weidi Xie
cs.AI
Zusammenfassung
Die automatisierte Interpretation von CT-Bildern – insbesondere die Lokalisierung und Beschreibung von abnormalen Befunden in multiplanaren und Ganzkörperaufnahmen – bleibt eine bedeutende Herausforderung in der klinischen Radiologie. Diese Arbeit zielt darauf ab, diese Herausforderung durch vier wesentliche Beiträge zu adressieren: (i) In Bezug auf die Taxonomie arbeiten wir mit erfahrenen Radiologen zusammen, um ein umfassendes hierarchisches Klassifikationssystem vorzuschlagen, das 404 repräsentative abnormale Befunde aus allen Körperregionen umfasst; (ii) Im Bereich der Daten stellen wir einen Datensatz bereit, der über 14.500 CT-Bilder aus multiplanaren Aufnahmen und allen menschlichen Körperregionen enthält, und liefern sorgfältig annotierte Referenzdaten für über 19.000 Abnormalitäten, die jeweils mit detaillierten Beschreibungen versehen und in die Taxonomie eingeordnet sind; (iii) Bei der Modellentwicklung präsentieren wir OminiAbnorm-CT, das automatisch abnormale Befunde in multiplanaren und Ganzkörper-CT-Bildern basierend auf Textanfragen lokalisieren und beschreiben kann, während es gleichzeitig flexible Interaktionen durch visuelle Eingaben ermöglicht; (iv) Im Hinblick auf Benchmarks etablieren wir drei repräsentative Evaluierungsaufgaben, die auf realen klinischen Szenarien basieren. Durch umfangreiche Experimente zeigen wir, dass OminiAbnorm-CT bestehende Methoden in allen Aufgaben und Metriken deutlich übertreffen kann.
English
Automated interpretation of CT images-particularly localizing and describing
abnormal findings across multi-plane and whole-body scans-remains a significant
challenge in clinical radiology. This work aims to address this challenge
through four key contributions: (i) On taxonomy, we collaborate with senior
radiologists to propose a comprehensive hierarchical classification system,
with 404 representative abnormal findings across all body regions; (ii) On
data, we contribute a dataset containing over 14.5K CT images from multiple
planes and all human body regions, and meticulously provide grounding
annotations for over 19K abnormalities, each linked to the detailed description
and cast into the taxonomy; (iii) On model development, we propose
OminiAbnorm-CT, which can automatically ground and describe abnormal findings
on multi-plane and whole-body CT images based on text queries, while also
allowing flexible interaction through visual prompts; (iv) On benchmarks, we
establish three representative evaluation tasks based on real clinical
scenarios. Through extensive experiments, we show that OminiAbnorm-CT can
significantly outperform existing methods on all the tasks and metrics.