Repensando a Interpretação de Imagens de TC de Corpo Inteiro: Uma Abordagem Centrada em Anormalidades
Rethinking Whole-Body CT Image Interpretation: An Abnormality-Centric Approach
June 3, 2025
Autores: Ziheng Zhao, Lisong Dai, Ya Zhang, Yanfeng Wang, Weidi Xie
cs.AI
Resumo
A interpretação automatizada de imagens de TC - particularmente a localização e descrição de achados anormais em varreduras multiplanares e de corpo inteiro - continua sendo um desafio significativo na radiologia clínica. Este trabalho visa abordar esse desafio por meio de quatro contribuições principais: (i) Na taxonomia, colaboramos com radiologistas seniores para propor um sistema de classificação hierárquica abrangente, com 404 achados anormais representativos em todas as regiões do corpo; (ii) Em relação aos dados, contribuímos com um conjunto de dados contendo mais de 14,5 mil imagens de TC de múltiplos planos e de todas as regiões do corpo humano, e fornecemos meticulosamente anotações de referência para mais de 19 mil anormalidades, cada uma vinculada à descrição detalhada e inserida na taxonomia; (iii) No desenvolvimento de modelos, propomos o OminiAbnorm-CT, que pode automaticamente localizar e descrever achados anormais em imagens de TC multiplanares e de corpo inteiro com base em consultas textuais, além de permitir interação flexível por meio de prompts visuais; (iv) Em termos de benchmarks, estabelecemos três tarefas de avaliação representativas baseadas em cenários clínicos reais. Por meio de extensos experimentos, demonstramos que o OminiAbnorm-CT pode superar significativamente os métodos existentes em todas as tarefas e métricas.
English
Automated interpretation of CT images-particularly localizing and describing
abnormal findings across multi-plane and whole-body scans-remains a significant
challenge in clinical radiology. This work aims to address this challenge
through four key contributions: (i) On taxonomy, we collaborate with senior
radiologists to propose a comprehensive hierarchical classification system,
with 404 representative abnormal findings across all body regions; (ii) On
data, we contribute a dataset containing over 14.5K CT images from multiple
planes and all human body regions, and meticulously provide grounding
annotations for over 19K abnormalities, each linked to the detailed description
and cast into the taxonomy; (iii) On model development, we propose
OminiAbnorm-CT, which can automatically ground and describe abnormal findings
on multi-plane and whole-body CT images based on text queries, while also
allowing flexible interaction through visual prompts; (iv) On benchmarks, we
establish three representative evaluation tasks based on real clinical
scenarios. Through extensive experiments, we show that OminiAbnorm-CT can
significantly outperform existing methods on all the tasks and metrics.