# Informe Técnico de MedGemma 1.5

Resumen

Presentamos MedGemma 1.5 4B, el modelo más reciente de la colección MedGemma. MedGemma 1.5 amplía las capacidades de MedGemma 1 mediante la integración de nuevas funcionalidades: imágenes médicas de alta dimensión (volúmenes de TC/IRM e imágenes de patología completa de muestras histológicas), localización anatómica mediante cuadros delimitadores, análisis de radiografías de tórax en múltiples puntos temporales y una mejor comprensión de documentos médicos (informes de laboratorio, registros electrónicos de salud). Detallamos las innovaciones necesarias para habilitar estas modalidades en una única arquitectura, incluyendo nuevos datos de entrenamiento, segmentación de volúmenes 3D de contexto largo y muestreo de patología de muestras completas. En comparación con MedGemma 1 4B, MedGemma 1.5 4B demuestra mejoras significativas en estas nuevas áreas, aumentando la precisión en la clasificación de condiciones en IRM 3D en un 11% y en TC 3D en un 3% (mejoras absolutas). En imágenes de patología de muestras completas, MedGemma 1.5 4B logra una ganancia del 47% en F1 macro. Además, mejora la localización anatómica con un aumento del 35% en la Intersección sobre la Unión en radiografías de tórax y alcanza un 4% de precisión macro en el análisis longitudinal (multitemporal) de radiografías de tórax. Más allá de su mejor rendimiento multimodal sobre MedGemma 1, MedGemma 1.5 también mejora en conocimiento clínico y razonamiento basado en texto, con un aumento del 5% en la precisión de MedQA y del 22% en la de EHRQA. También logra un promedio del 18% en F1 macro en 4 conjuntos de datos diferentes de extracción de información de informes de laboratorio (Conjuntos de Datos EHR 2, 3, 4 y Mendeley Clinical Laboratory Test Reports). En conjunto, MedGemma 1.5 sirve como un recurso abierto y robusto para la comunidad, diseñado como una base mejorada sobre la cual los desarrolladores pueden crear la próxima generación de sistemas de IA médica. Los recursos y tutoriales para trabajar con MedGemma 1.5 se pueden encontrar en https://goo.gle/MedGemma.

English

We introduce MedGemma 1.5 4B, the latest model in the MedGemma collection. MedGemma 1.5 expands on MedGemma 1 by integrating additional capabilities: high-dimensional medical imaging (CT/MRI volumes and histopathology whole slide images), anatomical localization via bounding boxes, multi-timepoint chest X-ray analysis, and improved medical document understanding (lab reports, electronic health records). We detail the innovations required to enable these modalities within a single architecture, including new training data, long-context 3D volume slicing, and whole-slide pathology sampling. Compared to MedGemma 1 4B, MedGemma 1.5 4B demonstrates significant gains in these new areas, improving 3D MRI condition classification accuracy by 11% and 3D CT condition classification by 3% (absolute improvements). In whole slide pathology imaging, MedGemma 1.5 4B achieves a 47% macro F1 gain. Additionally, it improves anatomical localization with a 35% increase in Intersection over Union on chest X-rays and achieves a 4% macro accuracy for longitudinal (multi-timepoint) chest x-ray analysis. Beyond its improved multimodal performance over MedGemma 1, MedGemma 1.5 improves on text-based clinical knowledge and reasoning, improving by 5% on MedQA accuracy and 22% on EHRQA accuracy. It also achieves an average of 18% macro F1 on 4 different lab report information extraction datasets (EHR Datasets 2, 3, 4, and Mendeley Clinical Laboratory Test Reports). Taken together, MedGemma 1.5 serves as a robust, open resource for the community, designed as an improved foundation on which developers can create the next generation of medical AI systems. Resources and tutorials for building upon MedGemma 1.5 can be found at https://goo.gle/MedGemma.

# Informe Técnico de MedGemma 1.5

MedGemma 1.5 Technical Report

Resumen

Support