RadAgent: Um agente de IA com uso de ferramentas para interpretação passo a passo de tomografia computadorizada de tórax

Resumo

Os modelos visão-linguagem (VLM) avançaram significativamente a interpretação e emissão de relatórios de imagens médicas complexas, como a tomografia computadorizada (TC), orientadas por IA. No entanto, os métodos existentes relegam amplamente os clínicos à condição de observadores passivos dos resultados finais, sem oferecer um rastro de raciocínio interpretável para inspecionar, validar ou refinar. Para resolver isso, apresentamos o RadAgent, um agente de IA que utiliza ferramentas para gerar relatórios de TC por meio de um processo gradual e interpretável. Cada relatório resultante é acompanhado por um rastro totalmente inspecionável de decisões intermediárias e interações com ferramentas, permitindo que os clínicos examinem como os achados relatados são derivados. Em nossos experimentos, observamos que o RadAgent melhora a geração de relatórios de TC de tórax em comparação com sua contraparte VLM 3D, o CT-Chat, em três dimensões. A precisão clínica melhora em 6,0 pontos (36,4% relativo) no macro-F1 e 5,4 pontos (19,6% relativo) no micro-F1. A robustez sob condições adversas melhora em 24,7 pontos (41,9% relativo). Além disso, o RadAgent alcança 37,0% em fidelidade (faithfulness), uma nova capacidade totalmente ausente em sua contraparte VLM 3D. Ao estruturar a interpretação da TC de tórax como um rastro de raciocínio explícito, aumentado por ferramentas e iterativo, o RadAgent nos aproxima de uma IA transparente e confiável para radiologia.

English

Vision-language models (VLM) have markedly advanced AI-driven interpretation and reporting of complex medical imaging, such as computed tomography (CT). Yet, existing methods largely relegate clinicians to passive observers of final outputs, offering no interpretable reasoning trace for them to inspect, validate, or refine. To address this, we introduce RadAgent, a tool-using AI agent that generates CT reports through a stepwise and interpretable process. Each resulting report is accompanied by a fully inspectable trace of intermediate decisions and tool interactions, allowing clinicians to examine how the reported findings are derived. In our experiments, we observe that RadAgent improves Chest CT report generation over its 3D VLM counterpart, CT-Chat, across three dimensions. Clinical accuracy improves by 6.0 points (36.4% relative) in macro-F1 and 5.4 points (19.6% relative) in micro-F1. Robustness under adversarial conditions improves by 24.7 points (41.9% relative). Furthermore, RadAgent achieves 37.0% in faithfulness, a new capability entirely absent in its 3D VLM counterpart. By structuring the interpretation of chest CT as an explicit, tool-augmented and iterative reasoning trace, RadAgent brings us closer toward transparent and reliable AI for radiology.

RadAgent: Um agente de IA com uso de ferramentas para interpretação passo a passo de tomografia computadorizada de tórax

RadAgent: A tool-using AI agent for stepwise interpretation of chest computed tomography

Resumo

Support