ChatPaper.aiChatPaper

CURE-Med:多言語医療推論のためのカリキュラム情報強化型強化学習

CURE-Med: Curriculum-Informed Reinforcement Learning for Multilingual Medical Reasoning

January 19, 2026
著者: Eric Onyame, Akash Ghosh, Subhadip Baidya, Sriparna Saha, Xiuying Chen, Chirag Agarwal
cs.AI

要旨

大規模言語モデル(LLM)は単一言語における数学的・常識的推論では高い性能を示すことが実証されているものの、多言語医療推論アプリケーションでは信頼性が低く、多言語医療環境への展開が妨げられている。本研究ではまず、アムハラ語、ヨルバ語、スワヒリ語などのリソース不足言語を含む13言語にわたる、単一の検証可能な回答を要する自由記述型推論クエリから構成される高品質な多言語医療推論データセット「CUREMED-BENCH」を導入する。このデータセットに基づき、コードスイッチングを考慮した教師ありファインチューニングとGroup Relative Policy Optimizationを統合し、論理的正確性と言語安定性を同時に改善するカリキュラム学習に基づく強化学習フレームワーク「CURE-MED」を提案する。13言語にわたる評価において、本手法は強力なベースラインを一貫して上回り、高い拡張性を示した。具体的には、70億パラメータモデルでは85.21%の言語一貫性と54.35%の論理的正確性を、320億パラメータモデルでは94.96%の言語一貫性と70.04%の論理的正確性を達成した。これらの結果は、LLMにおける信頼性が高く公平な多言語医療推論の実現を支持するものである。コードとデータセットはhttps://cure-med.github.io/で公開されている。
English
While large language models (LLMs) have shown to perform well on monolingual mathematical and commonsense reasoning, they remain unreliable for multilingual medical reasoning applications, hindering their deployment in multilingual healthcare settings. We address this by first introducing CUREMED-BENCH, a high-quality multilingual medical reasoning dataset with open-ended reasoning queries with a single verifiable answer, spanning thirteen languages, including underrepresented languages such as Amharic, Yoruba, and Swahili. Building on this dataset, we propose CURE-MED, a curriculum-informed reinforcement learning framework that integrates code-switching-aware supervised fine-tuning and Group Relative Policy Optimization to jointly improve logical correctness and language stability. Across thirteen languages, our approach consistently outperforms strong baselines and scales effectively, achieving 85.21% language consistency and 54.35% logical correctness at 7B parameters, and 94.96% language consistency and 70.04% logical correctness at 32B parameters. These results support reliable and equitable multilingual medical reasoning in LLMs. The code and dataset are available at https://cure-med.github.io/
PDF01January 23, 2026