MentraSuite: Посттренировочные большие языковые модели для рассуждений и оценки в области психического здоровья
MentraSuite: Post-Training Large Language Models for Mental Health Reasoning and Assessment
December 10, 2025
Авторы: Mengxi Xiao, Kailai Yang, Pengde Zhao, Enze Zhang, Ziyan Kuang, Zhiwei Liu, Weiguang Han, Shu Liao, Lianting Huang, Jinpeng Hu, Min Peng, Qianqian Xie, Sophia Ananiadou
cs.AI
Аннотация
Психические расстройства затрагивают сотни миллионов людей по всему миру, а Интернет стал основным средством получения поддержки, информации и диагностики. Большие языковые модели (БЯМ) предлагают масштабируемую и доступную помощь, однако их применение в сфере психического здоровья остается рискованным, когда их рассуждения являются неполными, непоследовательными или необоснованными. Существующие психологические БЯМ делают акцент на эмоциональном понимании или воспроизведении знаний, но упускают пошаговые, клинически выверенные рассуждения, необходимые для оценки, диагностики, планирования вмешательств, абстрагирования и верификации. Для решения этих проблем мы представляем MentraSuite — унифицированную структуру для развития надежных рассуждений в области психического здоровья. Мы предлагаем MentraBench, комплексный эталонный набор, охватывающий пять ключевых аспектов рассуждений, шесть задач и 13 наборов данных, который оценивает как производительность при решении задач, так и качество рассуждений по пяти параметрам: лаконичность, связность, избегание галлюцинаций, понимание задачи и внутренняя согласованность. Далее мы представляем Mindora, дообученную модель, оптимизированную с помощью гибридного SFT-RL фреймворка с функцией вознаграждения за обнаружение противоречий для обеспечения достоверных и последовательных рассуждений. Для поддержки обучения мы создаем высококачественные траектории, используя новую стратегию генерации траекторий рассуждений, которая стратегически фильтрует сложные примеры и применяет структурированный процесс переформулирования, ориентированный на согласованность, для создания лаконичных, удобочитаемых и сбалансированных траекторий. Среди 20 оцененных БЯМ модель Mindora демонстрирует наивысшую среднюю производительность на MentraBench и выдающиеся результаты по надежности рассуждений, что подтверждает ее эффективность для сложных сценариев в сфере психического здоровья.
English
Mental health disorders affect hundreds of millions globally, and the Web now serves as a primary medium for accessing support, information, and assessment. Large language models (LLMs) offer scalable and accessible assistance, yet their deployment in mental-health settings remains risky when their reasoning is incomplete, inconsistent, or ungrounded. Existing psychological LLMs emphasize emotional understanding or knowledge recall but overlook the step-wise, clinically aligned reasoning required for appraisal, diagnosis, intervention planning, abstraction, and verification. To address these issues, we introduce MentraSuite, a unified framework for advancing reliable mental-health reasoning. We propose MentraBench, a comprehensive benchmark spanning five core reasoning aspects, six tasks, and 13 datasets, evaluating both task performance and reasoning quality across five dimensions: conciseness, coherence, hallucination avoidance, task understanding, and internal consistency. We further present Mindora, a post-trained model optimized through a hybrid SFT-RL framework with an inconsistency-detection reward to enforce faithful and coherent reasoning. To support training, we construct high-quality trajectories using a novel reasoning trajectory generation strategy, that strategically filters difficult samples and applies a structured, consistency-oriented rewriting process to produce concise, readable, and well-balanced trajectories. Across 20 evaluated LLMs, Mindora achieves the highest average performance on MentraBench and shows remarkable performances in reasoning reliability, demonstrating its effectiveness for complex mental-health scenarios.