Voorbij Voorbeelden: Hoog-niveau Geautomatiseerd Redeneerparadigma in In-Context Leren via MCTS
Beyond Examples: High-level Automated Reasoning Paradigm in In-Context Learning via MCTS
November 27, 2024
Auteurs: Jinyang Wu, Mingkuan Feng, Shuai Zhang, Feihu Che, Zengqi Wen, Jianhua Tao
cs.AI
Samenvatting
In-context Learning (ICL) stelt grote taalmodellen (LLM's) in staat om downstream taken aan te pakken door geavanceerde aanwijzingen en hoogwaardige demonstraties. Echter, dit traditionele ICL paradigma vertoont beperkingen bij het omgaan met complexe wiskundige redeneertaken, voornamelijk vanwege de zware afhankelijkheid van voorbeeldkwaliteit en de noodzaak van menselijke tussenkomst in uitdagende scenario's. Om deze beperkingen aan te pakken, presenteert dit artikel HiAR-ICL, een High-level Automated Reasoning paradigma in ICL dat de focus verlegt van specifieke voorbeelden naar abstract denkpatronen, waarbij het conventionele concept van context in ICL wordt uitgebreid. HiAR-ICL introduceert vijf atomische redeneeracties als fundamentele componenten voor het construeren van keten-gestructureerde patronen. Met behulp van Monte Carlo Tree Search verkennen we redeneerpaden en construeren we gedachtekkaarten om daaropvolgende inferentie te begeleiden. Vervolgens ontwikkelen we een cognitief complexiteitskader dat problemen dynamisch koppelt aan passende gedachtekkaarten. Experimentele resultaten tonen de effectiviteit van HiAR-ICL aan, met een state-of-the-art nauwkeurigheid (79,6%) op de MATH benchmark met Qwen2.5-7B-Instruct, waarbij GPT-4o (76,6%) en Claude 3.5 (71,1%) worden overtroffen.
English
In-context Learning (ICL) enables large language models (LLMs) to tackle
downstream tasks through sophisticated prompting and high-quality
demonstrations. However, this traditional ICL paradigm shows limitations when
facing complex mathematical reasoning tasks, primarily due to its heavy
dependence on example quality and the necessity for human intervention in
challenging scenarios. To address these limitations, this paper presents
HiAR-ICL, a High-level Automated Reasoning paradigm
in ICL that shifts focus from specific examples to abstract thinking
patterns, extending the conventional concept of context in ICL. HiAR-ICL
introduces five atomic reasoning actions as fundamental components for
constructing chain-structured patterns. Using Monte Carlo Tree Search, we
explore reasoning paths and construct thought cards to guide subsequent
inference. We then develop a cognitive complexity framework that dynamically
matches problems with appropriate thought cards. Experimental results
demonstrate HiAR-ICL's effectiveness, achieving state-of-the-art accuracy
(79.6%) on the MATH benchmark with Qwen2.5-7B-Instruct, surpassing GPT-4o
(76.6%) and Claude 3.5 (71.1%).