ChatPaper.aiChatPaper

Baichuan-M3: Modelagem de Investigação Clínica para Tomada de Decisão Médica Confiável

Baichuan-M3: Modeling Clinical Inquiry for Reliable Medical Decision-Making

February 6, 2026
Autores: Baichuan-M3 Team, Chengfeng Dou, Fan Yang, Fei Li, Jiyuan Jia, Qiang Ju, Shuai Wang, Tianpeng Li, Xiangrong Zeng, Yijie Zhou, Hongda Zhang, Jinyang Tai, Linzhuang Sun, Peidong Guo, Yichuan Mo, Xiaochuan Wang, Hengfu Cui, Zhishou Zhang
cs.AI

Resumo

Apresentamos o Baichuan-M3, um modelo de linguagem de grande escala com aprimoramento médico, projetado para mudar o paradigma do questionamento e resposta passivo para um suporte ativo à decisão de nível clínico. Para superar as limitações dos sistemas existentes em consultas de escopo aberto, o Baichuan-M3 utiliza um *pipeline* de treinamento especializado para modelar o fluxo de trabalho sistemático de um médico. As capacidades principais incluem: (i) aquisição proativa de informações para resolver ambiguidades; (ii) raciocínio de longo horizonte que unifica evidências dispersas em diagnósticos coerentes; e (iii) supressão adaptativa de alucinações para garantir confiabilidade factual. Avaliações empíricas demonstram que o Baichuan-M3 alcança resultados de última geração no HealthBench, no recém-introduzido HealthBench-Hallu e no ScanBench, superando significativamente o GPT-5.2 em investigação clínica, aconselhamento e segurança. Os modelos estão publicamente disponíveis em https://huggingface.co/collections/baichuan-inc/baichuan-m3.
English
We introduce Baichuan-M3, a medical-enhanced large language model engineered to shift the paradigm from passive question-answering to active, clinical-grade decision support. Addressing the limitations of existing systems in open-ended consultations, Baichuan-M3 utilizes a specialized training pipeline to model the systematic workflow of a physician. Key capabilities include: (i) proactive information acquisition to resolve ambiguity; (ii) long-horizon reasoning that unifies scattered evidence into coherent diagnoses; and (iii) adaptive hallucination suppression to ensure factual reliability. Empirical evaluations demonstrate that Baichuan-M3 achieves state-of-the-art results on HealthBench, the newly introduced HealthBench-Hallu and ScanBench, significantly outperforming GPT-5.2 in clinical inquiry, advisory and safety. The models are publicly available at https://huggingface.co/collections/baichuan-inc/baichuan-m3.
PDF613March 31, 2026