За пределами примеров: высокоуровневая парадигма автоматизированного рассуждения в контекстном обучении с использованием MCTS.
Beyond Examples: High-level Automated Reasoning Paradigm in In-Context Learning via MCTS
November 27, 2024
Авторы: Jinyang Wu, Mingkuan Feng, Shuai Zhang, Feihu Che, Zengqi Wen, Jianhua Tao
cs.AI
Аннотация
Обучение в контексте (ICL) позволяет крупным языковым моделям (LLM) решать последующие задачи с помощью сложных подсказок и высококачественных демонстраций. Однако традиционная парадигма ICL показывает ограничения при решении сложных математических задач, в основном из-за сильной зависимости от качества примеров и необходимости вмешательства человека в сложных сценариях. Для преодоления этих ограничений в данной статье представлена HiAR-ICL, парадигма автоматизированного высокоуровневого рассуждения в ICL, которая смещает фокус с конкретных примеров на абстрактные мыслительные шаблоны, расширяя традиционное понятие контекста в ICL. HiAR-ICL вводит пять атомарных действий рассуждения как фундаментальные компоненты для построения цепных структурных шаблонов. С помощью поиска по дереву Монте-Карло мы исследуем пути рассуждений и создаем карточки мыслей для направления последующего вывода. Затем мы разрабатываем когнитивную модель сложности, которая динамически подбирает проблемы к соответствующим карточкам мыслей. Экспериментальные результаты демонстрируют эффективность HiAR-ICL, достигая передовой точности (79.6%) на математическом бенчмарке MATH с Qwen2.5-7B-Instruct, превосходя GPT-4o (76.6%) и Claude 3.5 (71.1%).
English
In-context Learning (ICL) enables large language models (LLMs) to tackle
downstream tasks through sophisticated prompting and high-quality
demonstrations. However, this traditional ICL paradigm shows limitations when
facing complex mathematical reasoning tasks, primarily due to its heavy
dependence on example quality and the necessity for human intervention in
challenging scenarios. To address these limitations, this paper presents
HiAR-ICL, a High-level Automated Reasoning paradigm
in ICL that shifts focus from specific examples to abstract thinking
patterns, extending the conventional concept of context in ICL. HiAR-ICL
introduces five atomic reasoning actions as fundamental components for
constructing chain-structured patterns. Using Monte Carlo Tree Search, we
explore reasoning paths and construct thought cards to guide subsequent
inference. We then develop a cognitive complexity framework that dynamically
matches problems with appropriate thought cards. Experimental results
demonstrate HiAR-ICL's effectiveness, achieving state-of-the-art accuracy
(79.6%) on the MATH benchmark with Qwen2.5-7B-Instruct, surpassing GPT-4o
(76.6%) and Claude 3.5 (71.1%).Summary
AI-Generated Summary