ChatPaper.aiChatPaper

AyurParam:アーユルヴェーダ分野における最先端の二言語対応言語モデル

AyurParam: A State-of-the-Art Bilingual Language Model for Ayurveda

November 4, 2025
著者: Mohd Nauman, Sravan Gvm, Vijay Devane, Shyam Pawar, Viraj Thakur, Kundeshwar Pundalik, Piyush Sawarkar, Rohit Saluja, Maunendra Desarkar, Ganesh Ramakrishnan
cs.AI

要旨

現在の大規模言語モデルは、広範な汎用タスクにおいて優れた性能を発揮するが、深い文化的・言語的・専門的知識を要する高度に専門化された領域では一貫して性能が低下する。特にアーユルヴェーダのような伝統医療体系は、数世紀にわたる微妙なニュアンスを含む文献的・臨床的知見を具現化しており、主流の大規模言語モデルはこれを正確に解釈・適用することができない。本論文では、古典文献と臨床ガイダンスにわたる専門家精選のアーユルヴェーダデータセットを用いてParam-1-2.9Bからファインチューニングした、ドメイン特化型の二言語対応モデルAyurParam-2.9Bを提案する。AyurParamのデータセットは、英語とヒンディー語による文脈認識型推論問題および客観式Q&Aを包含し、事実の正確性と指導の明確性を担保するための厳格な注釈プロトコルを採用している。BhashaBench-Ayurによる評価では、AyurParamは同規模クラス(1.5~3Bパラメータ)のオープンソース指令チューニングモデルを全て凌駕するだけでなく、遥かに大規模なモデルに対しても競争力あるいは優位な性能を示した。AyurParamの結果は、専門医療知識における信頼性が高く文化的に適合したAIを実現するためには、真正のドメイン適応と高品質な監督が不可欠であることを明らかにしている。
English
Current large language models excel at broad, general-purpose tasks, but consistently underperform when exposed to highly specialized domains that require deep cultural, linguistic, and subject-matter expertise. In particular, traditional medical systems such as Ayurveda embody centuries of nuanced textual and clinical knowledge that mainstream LLMs fail to accurately interpret or apply. We introduce AyurParam-2.9B, a domain-specialized, bilingual language model fine-tuned from Param-1-2.9B using an extensive, expertly curated Ayurveda dataset spanning classical texts and clinical guidance. AyurParam's dataset incorporates context-aware, reasoning, and objective-style Q&A in both English and Hindi, with rigorous annotation protocols for factual precision and instructional clarity. Benchmarked on BhashaBench-Ayur, AyurParam not only surpasses all open-source instruction-tuned models in its size class (1.5--3B parameters), but also demonstrates competitive or superior performance compared to much larger models. The results from AyurParam highlight the necessity for authentic domain adaptation and high-quality supervision in delivering reliable, culturally congruent AI for specialized medical knowledge.
PDF31December 2, 2025