Rapporto Tecnico di MedGemma 1.5

Abstract

Presentiamo MedGemma 1.5 4B, il modello più recente della collezione MedGemma. MedGemma 1.5 si espande su MedGemma 1 integrando capacità aggiuntive: imaging medico ad alta dimensionalità (volumi TC/RMN e immagini di interi vetrini di istopatologia), localizzazione anatomica tramite riquadri di delimitazione (bounding box), analisi di radiografie del torace a più punti temporali e una migliore comprensione dei documenti medici (referti di laboratorio, cartelle cliniche elettroniche). Descriviamo nel dettaglio le innovazioni necessarie per abilitare queste modalità all'interno di un'unica architettura, inclusi nuovi dati di addestramento, sezionamento di volumi 3D a contesto lungo e campionamento di interi vetrini per patologia. Rispetto a MedGemma 1 4B, MedGemma 1.5 4B dimostra miglioramenti significativi in queste nuove aree, aumentando l'accuratezza nella classificazione delle condizioni da RMN 3D dell'11% e nella classificazione delle condizioni da TC 3D del 3% (miglioramenti assoluti). Nell'imaging patologico di interi vetrini, MedGemma 1.5 4B raggiunge un guadagno del 47% nell'F1 macro. Inoltre, migliora la localizzazione anatomica con un aumento del 35% nell'Intersection over Union sulle radiografie del torace e raggiunge un'accuratezza macro del 4% per l'analisi longitudinale (a più punti temporali) delle radiografie del torace. Oltre alle prestazioni multimodali migliorate rispetto a MedGemma 1, MedGemma 1.5 mostra progressi nella conoscenza clinica e nel ragionamento basati su testo, migliorando del 5% l'accuratezza su MedQA e del 22% su EHRQA. Raggiunge inoltre una media del 18% di F1 macro su 4 diversi dataset di estrazione di informazioni da referti di laboratorio (EHR Dataset 2, 3, 4 e Mendeley Clinical Laboratory Test Reports). Nel complesso, MedGemma 1.5 si propone come una risorsa aperta e robusta per la comunità, concepita come una base migliorata sulla quale gli sviluppatori possono creare la prossima generazione di sistemi di intelligenza artificiale medica. Risorse e tutorial per costruire su MedGemma 1.5 sono disponibili all'indirizzo https://goo.gle/MedGemma.

English

We introduce MedGemma 1.5 4B, the latest model in the MedGemma collection. MedGemma 1.5 expands on MedGemma 1 by integrating additional capabilities: high-dimensional medical imaging (CT/MRI volumes and histopathology whole slide images), anatomical localization via bounding boxes, multi-timepoint chest X-ray analysis, and improved medical document understanding (lab reports, electronic health records). We detail the innovations required to enable these modalities within a single architecture, including new training data, long-context 3D volume slicing, and whole-slide pathology sampling. Compared to MedGemma 1 4B, MedGemma 1.5 4B demonstrates significant gains in these new areas, improving 3D MRI condition classification accuracy by 11% and 3D CT condition classification by 3% (absolute improvements). In whole slide pathology imaging, MedGemma 1.5 4B achieves a 47% macro F1 gain. Additionally, it improves anatomical localization with a 35% increase in Intersection over Union on chest X-rays and achieves a 4% macro accuracy for longitudinal (multi-timepoint) chest x-ray analysis. Beyond its improved multimodal performance over MedGemma 1, MedGemma 1.5 improves on text-based clinical knowledge and reasoning, improving by 5% on MedQA accuracy and 22% on EHRQA accuracy. It also achieves an average of 18% macro F1 on 4 different lab report information extraction datasets (EHR Datasets 2, 3, 4, and Mendeley Clinical Laboratory Test Reports). Taken together, MedGemma 1.5 serves as a robust, open resource for the community, designed as an improved foundation on which developers can create the next generation of medical AI systems. Resources and tutorials for building upon MedGemma 1.5 can be found at https://goo.gle/MedGemma.

Rapporto Tecnico di MedGemma 1.5

MedGemma 1.5 Technical Report

Abstract

Support