ChatPaper.aiChatPaper

Технический отчет MedGemma 1.5

MedGemma 1.5 Technical Report

April 6, 2026
Авторы: Andrew Sellergren, Chufan Gao, Fereshteh Mahvar, Timo Kohlberger, Fayaz Jamil, Madeleine Traverse, Alberto Tono, Bashir Sadjad, Lin Yang, Charles Lau, Liron Yatziv, Tiffany Chen, Bram Sterling, Kenneth Philbrick, Richa Tiwari, Yun Liu, Madhuram Jajoo, Chandrashekar Sankarapu, Swapnil Vispute, Harshad Purandare, Abhishek Bijay Mishra, Sam Schmidgall, Tao Tu, Anil Palepu, Chunjong Park, Tim Strother, Rahul Thapa, Yong Cheng, Preeti Singh, Kat Black, Yossi Matias, Katherine Chou, Avinatan Hassidim, Kavi Goel, Joelle Barral, Tris Warkentin, Shravya Shetty, Dale Webster, Sunny Virmani, David F. Steiner, Can Kirmizibayrak, Daniel Golden
cs.AI

Аннотация

Мы представляем MedGemma 1.5 4B — новейшую модель в семействе MedGemma. MedGemma 1.5 расширяет возможности MedGemma 1 за счет интеграции дополнительных функций: работы с высокоразмерными медицинскими изображениями (объемные данные КТ/МРТ и гистопатологические срезы целых слайдов), анатомической локализации с помощью ограничивающих рамок, анализа рентгенограмм грудной клетки в динамике и улучшенного понимания медицинской документации (лабораторные отчеты, электронные медицинские карты). Мы детально описываем инновации, необходимые для реализации этих модальностей в единой архитектуре, включая новые обучающие данные, срезы объемных 3D-данных длинного контекста и выборку целых патологических срезов. По сравнению с MedGemma 1 4B, модель MedGemma 1.5 4B демонстрирует значительный прогресс в новых областях: точность классификации состояний по 3D-МРТ повысилась на 11%, а по 3D-КТ — на 3% (абсолютные улучшения). В работе с изображениями целых патологических срезов достигнут прирост в 47% по макро-F1. Кроме того, улучшена анатомическая локализация — показатель IoU для рентгенограмм грудной клетки вырос на 35%, а для анализа продольных (многоточечных) рентгеновских снимков достигнута макро-точность в 4%. Помимо улучшенной многомодальной производительности, MedGemma 1.5 демонстрирует прогресс в области клинических знаний и рассуждений на основе текста: точность на MedQA повысилась на 5%, а на EHRQA — на 22%. Также модель достигает в среднем 18% макро-F1 на четырех наборах данных по извлечению информации из лабораторных отчетов (EHR Datasets 2, 3, 4 и Mendeley Clinical Laboratory Test Reports). В совокупности MedGemma 1.5 служит надежным открытым ресурсом для сообщества, предназначенным стать улучшенной основой для создания разработчиками следующего поколения медицинских ИИ-систем. Ресурсы и руководства для работы с MedGemma 1.5 доступны по адресу https://goo.gle/MedGemma.
English
We introduce MedGemma 1.5 4B, the latest model in the MedGemma collection. MedGemma 1.5 expands on MedGemma 1 by integrating additional capabilities: high-dimensional medical imaging (CT/MRI volumes and histopathology whole slide images), anatomical localization via bounding boxes, multi-timepoint chest X-ray analysis, and improved medical document understanding (lab reports, electronic health records). We detail the innovations required to enable these modalities within a single architecture, including new training data, long-context 3D volume slicing, and whole-slide pathology sampling. Compared to MedGemma 1 4B, MedGemma 1.5 4B demonstrates significant gains in these new areas, improving 3D MRI condition classification accuracy by 11% and 3D CT condition classification by 3% (absolute improvements). In whole slide pathology imaging, MedGemma 1.5 4B achieves a 47% macro F1 gain. Additionally, it improves anatomical localization with a 35% increase in Intersection over Union on chest X-rays and achieves a 4% macro accuracy for longitudinal (multi-timepoint) chest x-ray analysis. Beyond its improved multimodal performance over MedGemma 1, MedGemma 1.5 improves on text-based clinical knowledge and reasoning, improving by 5% on MedQA accuracy and 22% on EHRQA accuracy. It also achieves an average of 18% macro F1 on 4 different lab report information extraction datasets (EHR Datasets 2, 3, 4, and Mendeley Clinical Laboratory Test Reports). Taken together, MedGemma 1.5 serves as a robust, open resource for the community, designed as an improved foundation on which developers can create the next generation of medical AI systems. Resources and tutorials for building upon MedGemma 1.5 can be found at https://goo.gle/MedGemma.
PDF90April 9, 2026