例を超えて:MCTSを介したインコンテキスト学習における高レベルの自動推論パラダイム
Beyond Examples: High-level Automated Reasoning Paradigm in In-Context Learning via MCTS
November 27, 2024
著者: Jinyang Wu, Mingkuan Feng, Shuai Zhang, Feihu Che, Zengqi Wen, Jianhua Tao
cs.AI
要旨
インコンテキストラーニング(ICL)は、大規模言語モデル(LLM)が洗練されたプロンプティングと高品質なデモンストレーションを通じて下流タスクに取り組むことを可能にします。ただし、この従来のICLパラダイムは、複雑な数学的推論タスクに直面する際に制約が現れます。これは、例の品質への強い依存と、困難なシナリオでの人間の介入の必要性に主に起因します。これらの制約に対処するため、本論文では、HiAR-ICLと呼ばれる高レベル自動推論パラダイムを提案します。これは、ICLにおいて具体的な例から抽象的な思考パターンに焦点を移し、ICLにおける従来のコンテキストの概念を拡張します。HiAR-ICLは、チェーン構造のパターンを構築するための基本的な要素として、5つの原子推論アクションを導入します。モンテカルロ木探索を使用して推論経路を探索し、後続の推論を導くための思考カードを構築します。その後、問題を適切な思考カードに動的にマッチングする認知的複雑性フレームワークを開発します。実験結果は、HiAR-ICLの効果を示し、Qwen2.5-7B-Instructを使用したMATHベンチマークで最先端の精度(79.6%)を達成し、GPT-4o(76.6%)やClaude 3.5(71.1%)を上回りました。
English
In-context Learning (ICL) enables large language models (LLMs) to tackle
downstream tasks through sophisticated prompting and high-quality
demonstrations. However, this traditional ICL paradigm shows limitations when
facing complex mathematical reasoning tasks, primarily due to its heavy
dependence on example quality and the necessity for human intervention in
challenging scenarios. To address these limitations, this paper presents
HiAR-ICL, a High-level Automated Reasoning paradigm
in ICL that shifts focus from specific examples to abstract thinking
patterns, extending the conventional concept of context in ICL. HiAR-ICL
introduces five atomic reasoning actions as fundamental components for
constructing chain-structured patterns. Using Monte Carlo Tree Search, we
explore reasoning paths and construct thought cards to guide subsequent
inference. We then develop a cognitive complexity framework that dynamically
matches problems with appropriate thought cards. Experimental results
demonstrate HiAR-ICL's effectiveness, achieving state-of-the-art accuracy
(79.6%) on the MATH benchmark with Qwen2.5-7B-Instruct, surpassing GPT-4o
(76.6%) and Claude 3.5 (71.1%).Summary
AI-Generated Summary