ChatPaper.aiChatPaper

Baichuan-M3: Modellierung klinischer Anfragen für zuverlässige medizinische Entscheidungsfindung

Baichuan-M3: Modeling Clinical Inquiry for Reliable Medical Decision-Making

February 6, 2026
Autoren: Baichuan-M3 Team, Chengfeng Dou, Fan Yang, Fei Li, Jiyuan Jia, Qiang Ju, Shuai Wang, Tianpeng Li, Xiangrong Zeng, Yijie Zhou, Hongda Zhang, Jinyang Tai, Linzhuang Sun, Peidong Guo, Yichuan Mo, Xiaochuan Wang, Hengfu Cui, Zhishou Zhang
cs.AI

Zusammenfassung

Wir stellen Baichuan-M3 vor, ein medizinisch optimiertes großes Sprachmodell, das entwickelt wurde, um den Paradigmenwechsel von passiver Fragebeantwortung hin zu aktiver, klinisch hochwertiger Entscheidungsunterstützung zu vollziehen. Um die Grenzen bestehender Systeme bei offenen Konsultationen zu adressieren, nutzt Baichuan-M3 eine spezialisierte Trainingspipeline, um den systematischen Arbeitsablauf eines Arztes zu modellieren. Zu den Kernfähigkeiten gehören: (i) proaktive Informationsbeschaffung zur Auflösung von Mehrdeutigkeiten; (ii) langfristige Schlussfolgerungen, die verstreute Evidenz zu kohärenten Diagnosen vereinen; und (iii) adaptive Halluzinationsunterdrückung zur Gewährleistung faktischer Zuverlässigkeit. Empirische Auswertungen zeigen, dass Baichuan-M3 auf HealthBench, dem neu eingeführten HealthBench-Hallu und ScanBench state-of-the-art Ergebnisse erzielt und GPT-5.2 in klinischer Befragung, Beratung und Sicherheit signifikant übertrifft. Die Modelle sind öffentlich verfügbar unter https://huggingface.co/collections/baichuan-inc/baichuan-m3.
English
We introduce Baichuan-M3, a medical-enhanced large language model engineered to shift the paradigm from passive question-answering to active, clinical-grade decision support. Addressing the limitations of existing systems in open-ended consultations, Baichuan-M3 utilizes a specialized training pipeline to model the systematic workflow of a physician. Key capabilities include: (i) proactive information acquisition to resolve ambiguity; (ii) long-horizon reasoning that unifies scattered evidence into coherent diagnoses; and (iii) adaptive hallucination suppression to ensure factual reliability. Empirical evaluations demonstrate that Baichuan-M3 achieves state-of-the-art results on HealthBench, the newly introduced HealthBench-Hallu and ScanBench, significantly outperforming GPT-5.2 in clinical inquiry, advisory and safety. The models are publicly available at https://huggingface.co/collections/baichuan-inc/baichuan-m3.
PDF593March 16, 2026