Au-delà des exemples : Paradigme de raisonnement automatisé de haut niveau dans l'apprentissage en contexte via MCTS

papers.abstract

L'apprentissage en contexte (ICL) permet aux grands modèles de langage (LLM) de s'attaquer à des tâches ultérieures grâce à des incitations sophistiquées et des démonstrations de haute qualité. Cependant, ce paradigme traditionnel d'ICL montre des limites lorsqu'il est confronté à des tâches de raisonnement mathématique complexes, principalement en raison de sa forte dépendance à la qualité des exemples et de la nécessité d'une intervention humaine dans des scénarios difficiles. Pour remédier à ces limitations, cet article présente HiAR-ICL, un paradigme de raisonnement automatisé de haut niveau dans l'ICL qui déplace le focus des exemples spécifiques vers des schémas de pensée abstraite, étendant le concept conventionnel de contexte en ICL. HiAR-ICL introduit cinq actions de raisonnement atomiques en tant que composants fondamentaux pour construire des schémas structurés en chaîne. En utilisant la recherche arborescente Monte Carlo, nous explorons des chemins de raisonnement et construisons des cartes de pensée pour guider l'inférence ultérieure. Nous développons ensuite un cadre de complexité cognitive qui associe dynamiquement les problèmes aux cartes de pensée appropriées. Les résultats expérimentaux démontrent l'efficacité de HiAR-ICL, atteignant une précision de pointe (79,6 %) sur le banc d'essai MATH avec Qwen2.5-7B-Instruct, surpassant GPT-4o (76,6 %) et Claude 3.5 (71,1 %).

English

In-context Learning (ICL) enables large language models (LLMs) to tackle downstream tasks through sophisticated prompting and high-quality demonstrations. However, this traditional ICL paradigm shows limitations when facing complex mathematical reasoning tasks, primarily due to its heavy dependence on example quality and the necessity for human intervention in challenging scenarios. To address these limitations, this paper presents HiAR-ICL, a High-level Automated Reasoning paradigm in ICL that shifts focus from specific examples to abstract thinking patterns, extending the conventional concept of context in ICL. HiAR-ICL introduces five atomic reasoning actions as fundamental components for constructing chain-structured patterns. Using Monte Carlo Tree Search, we explore reasoning paths and construct thought cards to guide subsequent inference. We then develop a cognitive complexity framework that dynamically matches problems with appropriate thought cards. Experimental results demonstrate HiAR-ICL's effectiveness, achieving state-of-the-art accuracy (79.6%) on the MATH benchmark with Qwen2.5-7B-Instruct, surpassing GPT-4o (76.6%) and Claude 3.5 (71.1%).

Au-delà des exemples : Paradigme de raisonnement automatisé de haut niveau dans l'apprentissage en contexte via MCTS

Beyond Examples: High-level Automated Reasoning Paradigm in In-Context Learning via MCTS

papers.abstract

Support