ChatPaper.aiChatPaper

CURE-Med: 다국어 의료 추론을 위한 커리큘럼 기반 강화 학습

CURE-Med: Curriculum-Informed Reinforcement Learning for Multilingual Medical Reasoning

January 19, 2026
저자: Eric Onyame, Akash Ghosh, Subhadip Baidya, Sriparna Saha, Xiuying Chen, Chirag Agarwal
cs.AI

초록

대규모 언어 모델(LLM)이 단일 언어 수학 및 상식 추론 과제에서는 우수한 성능을 보이는 반면, 다국어 의료 추론 응용 분야에서는 여전히 신뢰할 수 없는 성능을 보여 다국어 의료 환경에서의 활용에 제약이 따릅니다. 본 연구는 이 문제를 해결하기 위해 먼저 CUREMED-BENCH를 소개합니다. 이는 열세 언어인 암하라어, 요루바어, 스와힐리어를 포함하여 13개 언어로 구성되고, 단일 검증 가능한 답변이 있는 개방형 추론 질의로 이루어진 고품질 다국어 의료 추론 데이터셋입니다. 이 데이터셋을 기반으로, 우리는 코드 전환(code-switching) 인지 지도 미세 조정과 Group Relative Policy Optimization을 통합하여 논리적 정확성과 언어 안정성을 함께 향상시키는 교과 과정 기반 강화 학습 프레임워크인 CURE-MED를 제안합니다. 13개 언어 전반에 걸쳐 우리의 접근법은 강력한 기준 모델들을 꾸준히 능가하며 효과적으로 확장되었는데, 70B 매개변수 기준으로 85.21%의 언어 일관성과 54.35%의 논리적 정확도를, 32B 매개변수 기준으로는 94.96%의 언어 일관성과 70.04%의 논리적 정확도를 달성했습니다. 이러한 결과는 LLM의 신뢰할 수 있고 공정한 다국어 의료 추론 가능성을 지지합니다. 코드와 데이터셋은 https://cure-med.github.io에서 이용할 수 있습니다.
English
While large language models (LLMs) have shown to perform well on monolingual mathematical and commonsense reasoning, they remain unreliable for multilingual medical reasoning applications, hindering their deployment in multilingual healthcare settings. We address this by first introducing CUREMED-BENCH, a high-quality multilingual medical reasoning dataset with open-ended reasoning queries with a single verifiable answer, spanning thirteen languages, including underrepresented languages such as Amharic, Yoruba, and Swahili. Building on this dataset, we propose CURE-MED, a curriculum-informed reinforcement learning framework that integrates code-switching-aware supervised fine-tuning and Group Relative Policy Optimization to jointly improve logical correctness and language stability. Across thirteen languages, our approach consistently outperforms strong baselines and scales effectively, achieving 85.21% language consistency and 54.35% logical correctness at 7B parameters, and 94.96% language consistency and 70.04% logical correctness at 32B parameters. These results support reliable and equitable multilingual medical reasoning in LLMs. The code and dataset are available at https://cure-med.github.io/
PDF01January 23, 2026