Fino1: 財務への推論強化LLMの転移可能性Fino1: On the Transferability of Reasoning Enhanced LLMs to Finance
最近の大規模言語モデル(LLM)の進歩により、強力な一般的な推論能力が示されていますが、金融推論における効果は未だに未開拓の領域です。本研究では、金融テキスト、表形式データ、および方程式を含む3つの複雑な金融タスクにおいて、16の強力な推論および一般的なLLMを包括的に評価し、数値推論、表形式解釈、金融用語理解、長文脈処理、および方程式に基づく問題解決を評価しました。結果は、より良いデータセットと事前学習が金融推論を向上させる一方、CoTのような一般的な強化は常に一貫した利益をもたらすわけではないことを示しています。さらに、すべての推論戦略が長文脈および複数の表形式タスクでのパフォーマンス向上に向けて課題に直面しています。これらの制限に対処するため、特定のドメイン推論パスを用いたCoTのファインチューニングと強化学習により、Llama-3.1-8B-Instructに基づく金融推論強化モデルを開発しました。1つの金融データセットでの簡単なファインチューニングでも、当社のモデルはタスク全体で一貫した10%のパフォーマンス向上を達成し、すべての8Bモデルを上回り、平均してLlama3-70B-InstructおよびLlama3.1-70B-Instructをも凌駕しています。結果は、金融タスクにおける特定のドメイン適応の必要性を強調し、複数の表形式推論、長文脈処理、および金融用語理解などの将来の方向性を重視しています。すべてのデータセット、モデル、コードは公開されています。さらに、将来のデータセットとモデルのベンチマークテストのためのリーダーボードを導入しています。