Au-delà des exemples : Paradigme de raisonnement automatisé de haut niveau dans l'apprentissage en contexte via MCTS
Beyond Examples: High-level Automated Reasoning Paradigm in In-Context Learning via MCTS
November 27, 2024
Auteurs: Jinyang Wu, Mingkuan Feng, Shuai Zhang, Feihu Che, Zengqi Wen, Jianhua Tao
cs.AI
Résumé
L'apprentissage en contexte (ICL) permet aux grands modèles de langage (LLM) de s'attaquer à des tâches ultérieures grâce à des incitations sophistiquées et des démonstrations de haute qualité. Cependant, ce paradigme traditionnel d'ICL montre des limites lorsqu'il est confronté à des tâches de raisonnement mathématique complexes, principalement en raison de sa forte dépendance à la qualité des exemples et de la nécessité d'une intervention humaine dans des scénarios difficiles. Pour remédier à ces limitations, cet article présente HiAR-ICL, un paradigme de raisonnement automatisé de haut niveau dans l'ICL qui déplace le focus des exemples spécifiques vers des schémas de pensée abstraite, étendant le concept conventionnel de contexte en ICL. HiAR-ICL introduit cinq actions de raisonnement atomiques en tant que composants fondamentaux pour construire des schémas structurés en chaîne. En utilisant la recherche arborescente Monte Carlo, nous explorons des chemins de raisonnement et construisons des cartes de pensée pour guider l'inférence ultérieure. Nous développons ensuite un cadre de complexité cognitive qui associe dynamiquement les problèmes aux cartes de pensée appropriées. Les résultats expérimentaux démontrent l'efficacité de HiAR-ICL, atteignant une précision de pointe (79,6 %) sur le banc d'essai MATH avec Qwen2.5-7B-Instruct, surpassant GPT-4o (76,6 %) et Claude 3.5 (71,1 %).
English
In-context Learning (ICL) enables large language models (LLMs) to tackle
downstream tasks through sophisticated prompting and high-quality
demonstrations. However, this traditional ICL paradigm shows limitations when
facing complex mathematical reasoning tasks, primarily due to its heavy
dependence on example quality and the necessity for human intervention in
challenging scenarios. To address these limitations, this paper presents
HiAR-ICL, a High-level Automated Reasoning paradigm
in ICL that shifts focus from specific examples to abstract thinking
patterns, extending the conventional concept of context in ICL. HiAR-ICL
introduces five atomic reasoning actions as fundamental components for
constructing chain-structured patterns. Using Monte Carlo Tree Search, we
explore reasoning paths and construct thought cards to guide subsequent
inference. We then develop a cognitive complexity framework that dynamically
matches problems with appropriate thought cards. Experimental results
demonstrate HiAR-ICL's effectiveness, achieving state-of-the-art accuracy
(79.6%) on the MATH benchmark with Qwen2.5-7B-Instruct, surpassing GPT-4o
(76.6%) and Claude 3.5 (71.1%).Summary
AI-Generated Summary