ChatPaper.aiChatPaper

AyurParam: 아유르베다 분야 최신 바이링괄 언어 모델

AyurParam: A State-of-the-Art Bilingual Language Model for Ayurveda

November 4, 2025
저자: Mohd Nauman, Sravan Gvm, Vijay Devane, Shyam Pawar, Viraj Thakur, Kundeshwar Pundalik, Piyush Sawarkar, Rohit Saluja, Maunendra Desarkar, Ganesh Ramakrishnan
cs.AI

초록

현재의 대규모 언어 모델은 광범위한 일반 목적 작업에서는 뛰어난 성능을 보이지만, 깊은 문화적·언어적·전문 분야 지식을 요구하는 고도로 전문화된 영역에서는 지속적으로 낮은 성능을 보입니다. 특히 아유르베다와 같은 전통 의학 체계는 수세기에 걸친 미묘한 문헌 및 임상 지식을 구현하고 있으나, 주류 대규모 언어 모델들은 이를 정확하게 해석하거나 적용하지 못하고 있습니다. 본 논문은 고전 문헌과 임상 지침을 아우르는 방대하고 전문가가 정성들여 구축한 아유르베다 데이터셋을 사용하여 Param-1-2.9B로부터 미세 조정된 전문화된 도메인 특화 이중 언어 모델인 AyurParam-2.9B를 소개합니다. AyurParam의 데이터셋은 영어와 힌디어로 된 맥락 인식, 추론, 객관식 스타일의 질의응답을 포함하며, 사실적 정확성과 교육적 명확성을 위한 엄격한 주석 프로토콜을 적용했습니다. BhashaBench-Ayur에서 벤치마크한 결과, AyurParam은 동일 규모 등급(15억~30억 매개변수)의 모든 오픈소스 지시 튜닝 모델을 능가할 뿐만 아니라, 훨씬 더 큰 모델들과 비교해서도 경쟁력 있거나 우수한 성능을 입증했습니다. AyurParam의 결과는 전문 의학 지식에 대해 신뢰할 수 있고 문화적으로 조화로운 AI를 제공하기 위해 진정한 도메인 적응과 고품질 감독(supervision)이 필수적임을 강조합니다.
English
Current large language models excel at broad, general-purpose tasks, but consistently underperform when exposed to highly specialized domains that require deep cultural, linguistic, and subject-matter expertise. In particular, traditional medical systems such as Ayurveda embody centuries of nuanced textual and clinical knowledge that mainstream LLMs fail to accurately interpret or apply. We introduce AyurParam-2.9B, a domain-specialized, bilingual language model fine-tuned from Param-1-2.9B using an extensive, expertly curated Ayurveda dataset spanning classical texts and clinical guidance. AyurParam's dataset incorporates context-aware, reasoning, and objective-style Q&A in both English and Hindi, with rigorous annotation protocols for factual precision and instructional clarity. Benchmarked on BhashaBench-Ayur, AyurParam not only surpasses all open-source instruction-tuned models in its size class (1.5--3B parameters), but also demonstrates competitive or superior performance compared to much larger models. The results from AyurParam highlight the necessity for authentic domain adaptation and high-quality supervision in delivering reliable, culturally congruent AI for specialized medical knowledge.
PDF31December 2, 2025