ChatPaper.aiChatPaper

Baichuan-M3: Modelado de Consultas Clínicas para una Toma de Decisiones Médicas Confiable

Baichuan-M3: Modeling Clinical Inquiry for Reliable Medical Decision-Making

February 6, 2026
Autores: Baichuan-M3 Team, Chengfeng Dou, Fan Yang, Fei Li, Jiyuan Jia, Qiang Ju, Shuai Wang, Tianpeng Li, Xiangrong Zeng, Yijie Zhou, Hongda Zhang, Jinyang Tai, Linzhuang Sun, Peidong Guo, Yichuan Mo, Xiaochuan Wang, Hengfu Cui, Zhishou Zhang
cs.AI

Resumen

Presentamos Baichuan-M3, un modelo de lenguaje grande de capacidades médicas mejoradas, diseñado para cambiar el paradigma de la mera respuesta pasiva de preguntas hacia un apoyo activo para la toma de decisiones de grado clínico. Para abordar las limitaciones de los sistemas existentes en consultas de respuesta abierta, Baichuan-M3 utiliza un pipeline de entrenamiento especializado que modela el flujo de trabajo sistemático de un médico. Sus capacidades clave incluyen: (i) adquisición proactiva de información para resolver ambigüedades; (ii) razonamiento de largo alcance que unifica evidencias dispersas en diagnósticos coherentes; y (iii) supresión adaptativa de alucinaciones para garantizar la fiabilidad factual. Las evaluaciones empíricas demuestran que Baichuan-M3 logra resultados de vanguardia en HealthBench, el recién introducido HealthBench-Hallu y ScanBench, superando significativamente a GPT-5.2 en consulta clínica, asesoramiento y seguridad. Los modelos están disponibles públicamente en https://huggingface.co/collections/baichuan-inc/baichuan-m3.
English
We introduce Baichuan-M3, a medical-enhanced large language model engineered to shift the paradigm from passive question-answering to active, clinical-grade decision support. Addressing the limitations of existing systems in open-ended consultations, Baichuan-M3 utilizes a specialized training pipeline to model the systematic workflow of a physician. Key capabilities include: (i) proactive information acquisition to resolve ambiguity; (ii) long-horizon reasoning that unifies scattered evidence into coherent diagnoses; and (iii) adaptive hallucination suppression to ensure factual reliability. Empirical evaluations demonstrate that Baichuan-M3 achieves state-of-the-art results on HealthBench, the newly introduced HealthBench-Hallu and ScanBench, significantly outperforming GPT-5.2 in clinical inquiry, advisory and safety. The models are publicly available at https://huggingface.co/collections/baichuan-inc/baichuan-m3.
PDF593March 16, 2026