Voorbij Voorbeelden: Hoog-niveau Geautomatiseerd Redeneerparadigma in In-Context Leren via MCTS

Samenvatting

In-context Learning (ICL) stelt grote taalmodellen (LLM's) in staat om downstream taken aan te pakken door geavanceerde aanwijzingen en hoogwaardige demonstraties. Echter, dit traditionele ICL paradigma vertoont beperkingen bij het omgaan met complexe wiskundige redeneertaken, voornamelijk vanwege de zware afhankelijkheid van voorbeeldkwaliteit en de noodzaak van menselijke tussenkomst in uitdagende scenario's. Om deze beperkingen aan te pakken, presenteert dit artikel HiAR-ICL, een High-level Automated Reasoning paradigma in ICL dat de focus verlegt van specifieke voorbeelden naar abstract denkpatronen, waarbij het conventionele concept van context in ICL wordt uitgebreid. HiAR-ICL introduceert vijf atomische redeneeracties als fundamentele componenten voor het construeren van keten-gestructureerde patronen. Met behulp van Monte Carlo Tree Search verkennen we redeneerpaden en construeren we gedachtekkaarten om daaropvolgende inferentie te begeleiden. Vervolgens ontwikkelen we een cognitief complexiteitskader dat problemen dynamisch koppelt aan passende gedachtekkaarten. Experimentele resultaten tonen de effectiviteit van HiAR-ICL aan, met een state-of-the-art nauwkeurigheid (79,6%) op de MATH benchmark met Qwen2.5-7B-Instruct, waarbij GPT-4o (76,6%) en Claude 3.5 (71,1%) worden overtroffen.

English

In-context Learning (ICL) enables large language models (LLMs) to tackle downstream tasks through sophisticated prompting and high-quality demonstrations. However, this traditional ICL paradigm shows limitations when facing complex mathematical reasoning tasks, primarily due to its heavy dependence on example quality and the necessity for human intervention in challenging scenarios. To address these limitations, this paper presents HiAR-ICL, a High-level Automated Reasoning paradigm in ICL that shifts focus from specific examples to abstract thinking patterns, extending the conventional concept of context in ICL. HiAR-ICL introduces five atomic reasoning actions as fundamental components for constructing chain-structured patterns. Using Monte Carlo Tree Search, we explore reasoning paths and construct thought cards to guide subsequent inference. We then develop a cognitive complexity framework that dynamically matches problems with appropriate thought cards. Experimental results demonstrate HiAR-ICL's effectiveness, achieving state-of-the-art accuracy (79.6%) on the MATH benchmark with Qwen2.5-7B-Instruct, surpassing GPT-4o (76.6%) and Claude 3.5 (71.1%).

Voorbij Voorbeelden: Hoog-niveau Geautomatiseerd Redeneerparadigma in In-Context Leren via MCTS

Beyond Examples: High-level Automated Reasoning Paradigm in In-Context Learning via MCTS

Samenvatting

Support