SaulLM-54B & SaulLM-141B: 法務ドメインにおけるドメイン適応のスケールアップSaulLM-54B & SaulLM-141B: Scaling Up Domain Adaptation for the Legal
Domain
本論文では、法律分野に特化した2つの大規模言語モデル(LLM)、SaulLM-54BとSaulLM-141Bを紹介する。これらのモデルは、それぞれ540億と1410億のパラメータを備えたMixtralアーキテクチャを基盤としている。SaulLM-54BとSaulLM-141Bの開発は、大規模なドメイン適応に基づいており、以下の3つの戦略に分けられる:(1) 5400億以上の法律関連トークンを含む基本コーパスを用いた継続的な事前学習の活用、(2) 法律分野に特化した指示追従プロトコルの実装、(3) 法律解釈におけるモデル出力と人間の選好の整合。第2および第3のステップでは、合成生成データを統合することで、法律文書の解釈と処理におけるモデルの能力が向上し、LegalBench-Instructにおいて最先端の性能を達成し、従来のオープンソースモデルを凌駕した。本研究は、この規模でのドメイン特化適応に伴うトレードオフを探り、強力なデコーダモデルを用いたドメイン適応に関する将来の研究に役立つ知見を提供する。SaulLM-7Bを基盤として、本研究は法律タスクに適したLLMを生成するためのアプローチを洗練させた。再利用と共同研究を促進するため、SaulLM-54BとSaulLM-141Bの基本版、指示版、および整合版をMITライセンスの下で公開する。