ChatPaper.aiChatPaper

Baichuan-M3: Моделирование клинического запроса для надежного принятия медицинских решений

Baichuan-M3: Modeling Clinical Inquiry for Reliable Medical Decision-Making

February 6, 2026
Авторы: Baichuan-M3 Team, Chengfeng Dou, Fan Yang, Fei Li, Jiyuan Jia, Qiang Ju, Shuai Wang, Tianpeng Li, Xiangrong Zeng, Yijie Zhou, Hongda Zhang, Jinyang Tai, Linzhuang Sun, Peidong Guo, Yichuan Mo, Xiaochuan Wang, Hengfu Cui, Zhishou Zhang
cs.AI

Аннотация

Мы представляем Baichuan-M3 — крупную языковую модель с медицинским уклоном, созданную для перехода от пассивного ответа на вопросы к активной поддержке решений клинического уровня. Преодолевая ограничения существующих систем в открытых консультациях, Baichuan-M3 использует специализированный конвейер обучения для моделирования системного рабочего процесса врача. Ключевые возможности включают: (i) активный сбор информации для устранения неоднозначности; (ii) долгосрочное рассуждение, объединяющее разрозненные данные в согласованные диагнозы; и (iii) адаптивное подавление галлюцинаций для обеспечения фактической достоверности. Эмпирические оценки демонстрируют, что Baichuan-M3 достигает передовых результатов на HealthBench, вновь представленных HealthBench-Hallu и ScanBench, значительно превосходя GPT-5.2 в клинических запросах, консультациях и безопасности. Модели общедоступны по адресу https://huggingface.co/collections/baichuan-inc/baichuan-m3.
English
We introduce Baichuan-M3, a medical-enhanced large language model engineered to shift the paradigm from passive question-answering to active, clinical-grade decision support. Addressing the limitations of existing systems in open-ended consultations, Baichuan-M3 utilizes a specialized training pipeline to model the systematic workflow of a physician. Key capabilities include: (i) proactive information acquisition to resolve ambiguity; (ii) long-horizon reasoning that unifies scattered evidence into coherent diagnoses; and (iii) adaptive hallucination suppression to ensure factual reliability. Empirical evaluations demonstrate that Baichuan-M3 achieves state-of-the-art results on HealthBench, the newly introduced HealthBench-Hallu and ScanBench, significantly outperforming GPT-5.2 in clinical inquiry, advisory and safety. The models are publicly available at https://huggingface.co/collections/baichuan-inc/baichuan-m3.
PDF593March 16, 2026