Relatório Técnico do MedGemma 1.5

Resumo

Apresentamos o MedGemma 1.5 4B, o modelo mais recente da coleção MedGemma. O MedGemma 1.5 expande as capacidades do MedGemma 1 ao integrar funcionalidades adicionais: imagiologia médica de alta dimensão (volumes de TC/RM e imagens de lâmina completa de histopatologia), localização anatómica através de caixas delimitadoras, análise de radiografias torácicas em múltiplos pontos temporais e uma melhor compreensão de documentos médicos (relatórios de laboratório, registos de saúde eletrónicos). Detalhamos as inovações necessárias para permitir estas modalidades numa única arquitetura, incluindo novos dados de treino, segmentação de volumes 3D de contexto longo e amostragem de patologia de lâmina completa. Em comparação com o MedGemma 1 4B, o MedGemma 1.5 4B demonstra ganhos significativos nestas novas áreas, melhorando a precisão da classificação de condições em RM 3D em 11% e em TC 3D em 3% (melhorias absolutas). Na imagem de patologia de lâmina completa, o MedGemma 1.5 4B alcança um ganho de 47% no F1-macro. Adicionalmente, melhora a localização anatómica com um aumento de 35% na Interseção sobre União em radiografias torácicas e atinge uma precisão macro de 4% na análise longitudinal (multitemporal) de radiografias torácicas. Para além do seu desempenho multimodal melhorado face ao MedGemma 1, o MedGemma 1.5 apresenta avanços no conhecimento clínico e raciocínio baseados em texto, melhorando 5% na precisão do MedQA e 22% na precisão do EHRQA. Alcança ainda uma média de 18% de F1-macro em 4 conjuntos de dados diferentes de extração de informação de relatórios de laboratório (EHR Datasets 2, 3, 4 e Mendeley Clinical Laboratory Test Reports). No seu conjunto, o MedGemma 1.5 serve como um recurso aberto e robusto para a comunidade, concebido como uma base melhorada sobre a qual os desenvolvedores podem criar a próxima geração de sistemas de IA médica. Recursos e tutoriais para construir com o MedGemma 1.5 podem ser encontrados em https://goo.gle/MedGemma.

English

We introduce MedGemma 1.5 4B, the latest model in the MedGemma collection. MedGemma 1.5 expands on MedGemma 1 by integrating additional capabilities: high-dimensional medical imaging (CT/MRI volumes and histopathology whole slide images), anatomical localization via bounding boxes, multi-timepoint chest X-ray analysis, and improved medical document understanding (lab reports, electronic health records). We detail the innovations required to enable these modalities within a single architecture, including new training data, long-context 3D volume slicing, and whole-slide pathology sampling. Compared to MedGemma 1 4B, MedGemma 1.5 4B demonstrates significant gains in these new areas, improving 3D MRI condition classification accuracy by 11% and 3D CT condition classification by 3% (absolute improvements). In whole slide pathology imaging, MedGemma 1.5 4B achieves a 47% macro F1 gain. Additionally, it improves anatomical localization with a 35% increase in Intersection over Union on chest X-rays and achieves a 4% macro accuracy for longitudinal (multi-timepoint) chest x-ray analysis. Beyond its improved multimodal performance over MedGemma 1, MedGemma 1.5 improves on text-based clinical knowledge and reasoning, improving by 5% on MedQA accuracy and 22% on EHRQA accuracy. It also achieves an average of 18% macro F1 on 4 different lab report information extraction datasets (EHR Datasets 2, 3, 4, and Mendeley Clinical Laboratory Test Reports). Taken together, MedGemma 1.5 serves as a robust, open resource for the community, designed as an improved foundation on which developers can create the next generation of medical AI systems. Resources and tutorials for building upon MedGemma 1.5 can be found at https://goo.gle/MedGemma.

Relatório Técnico do MedGemma 1.5

MedGemma 1.5 Technical Report

Resumo

Support