ChatPaper.aiChatPaper

例を超えて:MCTSを介したインコンテキスト学習における高レベルの自動推論パラダイム

Beyond Examples: High-level Automated Reasoning Paradigm in In-Context Learning via MCTS

November 27, 2024
著者: Jinyang Wu, Mingkuan Feng, Shuai Zhang, Feihu Che, Zengqi Wen, Jianhua Tao
cs.AI

要旨

インコンテキストラーニング(ICL)は、大規模言語モデル(LLM)が洗練されたプロンプティングと高品質なデモンストレーションを通じて下流タスクに取り組むことを可能にします。ただし、この従来のICLパラダイムは、複雑な数学的推論タスクに直面する際に制約が現れます。これは、例の品質への強い依存と、困難なシナリオでの人間の介入の必要性に主に起因します。これらの制約に対処するため、本論文では、HiAR-ICLと呼ばれる高レベル自動推論パラダイムを提案します。これは、ICLにおいて具体的な例から抽象的な思考パターンに焦点を移し、ICLにおける従来のコンテキストの概念を拡張します。HiAR-ICLは、チェーン構造のパターンを構築するための基本的な要素として、5つの原子推論アクションを導入します。モンテカルロ木探索を使用して推論経路を探索し、後続の推論を導くための思考カードを構築します。その後、問題を適切な思考カードに動的にマッチングする認知的複雑性フレームワークを開発します。実験結果は、HiAR-ICLの効果を示し、Qwen2.5-7B-Instructを使用したMATHベンチマークで最先端の精度(79.6%)を達成し、GPT-4o(76.6%)やClaude 3.5(71.1%)を上回りました。
English
In-context Learning (ICL) enables large language models (LLMs) to tackle downstream tasks through sophisticated prompting and high-quality demonstrations. However, this traditional ICL paradigm shows limitations when facing complex mathematical reasoning tasks, primarily due to its heavy dependence on example quality and the necessity for human intervention in challenging scenarios. To address these limitations, this paper presents HiAR-ICL, a High-level Automated Reasoning paradigm in ICL that shifts focus from specific examples to abstract thinking patterns, extending the conventional concept of context in ICL. HiAR-ICL introduces five atomic reasoning actions as fundamental components for constructing chain-structured patterns. Using Monte Carlo Tree Search, we explore reasoning paths and construct thought cards to guide subsequent inference. We then develop a cognitive complexity framework that dynamically matches problems with appropriate thought cards. Experimental results demonstrate HiAR-ICL's effectiveness, achieving state-of-the-art accuracy (79.6%) on the MATH benchmark with Qwen2.5-7B-Instruct, surpassing GPT-4o (76.6%) and Claude 3.5 (71.1%).

Summary

AI-Generated Summary

PDF3814December 2, 2024