MedGemma 1.5 Technischer Bericht

Zusammenfassung

Wir stellen MedGemma 1.5 4B vor, das neueste Modell der MedGemma-Reihe. MedGemma 1.5 erweitert MedGemma 1 durch die Integration zusätzlicher Fähigkeiten: hochdimensionale medizinische Bildgebung (CT/MRT-Volumina und Histopathologie-Ganzpräparate), anatomische Lokalisierung via Bounding Boxes, Mehrzeitpunkt-Analyse von Röntgenthoraxaufnahmen und verbessertes Verständnis medizinischer Dokumente (Laborberichte, elektronische Patientenakten). Wir erläutern die notwendigen Innovationen zur Umsetzung dieser Modalitäten in einer einzigen Architektur, darunter neue Trainingsdaten, Long-Context-3D-Volumensegmentierung und Ganzpräparat-Pathologie-Sampling. Im Vergleich zu MedGemma 1 4B zeigt MedGemma 1.5 4B signifikante Verbesserungen in diesen neuen Bereichen: Die Genauigkeit bei der 3D-MRT-Zustandsklassifikation steigt um 11 % und bei der 3D-CT-Zustandsklassifikation um 3 % (absolute Verbesserungen). In der Ganzpräparat-Pathologie-Bildgebung erzielt MedGemma 1.5 4B einen Zuwachs von 47 % im makro F1-Score. Zudem verbessert es die anatomische Lokalisierung mit einer 35 %-Steigerung des Intersection-over-Union-Werts bei Röntgenthoraxaufnahmen und erreicht eine makro Genauigkeit von 4 % bei der longitudinalen (Mehrzeitpunkt-) Analyse von Röntgenthoraxbildern. Neben der verbesserten multimodalen Leistung gegenüber MedGemma 1 steigert MedGemma 1.5 auch textbasiertes klinisches Wissen und Reasoning, mit einer 5 %-Verbesserung bei MedQA und 22 % bei EHRQA. Es erreicht durchschnittlich 18 % makro F1 bei vier verschiedenen Datensätzen zur Informationsextraktion aus Laborberichten (EHR Datasets 2, 3, 4 und Mendeley Clinical Laboratory Test Reports). Zusammengenommen dient MedGemma 1.5 als robuste, offene Ressource für die Community und ist als verbesserte Grundlage konzipiert, auf der Entwickler die nächste Generation medizinischer KI-Systeme aufbauen können. Ressourcen und Tutorials zur Weiterentwicklung von MedGemma 1.5 finden Sie unter https://goo.gle/MedGemma.

English

We introduce MedGemma 1.5 4B, the latest model in the MedGemma collection. MedGemma 1.5 expands on MedGemma 1 by integrating additional capabilities: high-dimensional medical imaging (CT/MRI volumes and histopathology whole slide images), anatomical localization via bounding boxes, multi-timepoint chest X-ray analysis, and improved medical document understanding (lab reports, electronic health records). We detail the innovations required to enable these modalities within a single architecture, including new training data, long-context 3D volume slicing, and whole-slide pathology sampling. Compared to MedGemma 1 4B, MedGemma 1.5 4B demonstrates significant gains in these new areas, improving 3D MRI condition classification accuracy by 11% and 3D CT condition classification by 3% (absolute improvements). In whole slide pathology imaging, MedGemma 1.5 4B achieves a 47% macro F1 gain. Additionally, it improves anatomical localization with a 35% increase in Intersection over Union on chest X-rays and achieves a 4% macro accuracy for longitudinal (multi-timepoint) chest x-ray analysis. Beyond its improved multimodal performance over MedGemma 1, MedGemma 1.5 improves on text-based clinical knowledge and reasoning, improving by 5% on MedQA accuracy and 22% on EHRQA accuracy. It also achieves an average of 18% macro F1 on 4 different lab report information extraction datasets (EHR Datasets 2, 3, 4, and Mendeley Clinical Laboratory Test Reports). Taken together, MedGemma 1.5 serves as a robust, open resource for the community, designed as an improved foundation on which developers can create the next generation of medical AI systems. Resources and tutorials for building upon MedGemma 1.5 can be found at https://goo.gle/MedGemma.

MedGemma 1.5 Technischer Bericht

MedGemma 1.5 Technical Report

Zusammenfassung

Support