Más allá de los Ejemplos: Paradigma de Razonamiento Automatizado de Alto Nivel en Aprendizaje en Contexto a través de MCTS
Beyond Examples: High-level Automated Reasoning Paradigm in In-Context Learning via MCTS
November 27, 2024
Autores: Jinyang Wu, Mingkuan Feng, Shuai Zhang, Feihu Che, Zengqi Wen, Jianhua Tao
cs.AI
Resumen
El Aprendizaje en Contexto (AC) permite a los grandes modelos de lenguaje (GML) abordar tareas posteriores a través de indicaciones sofisticadas y demostraciones de alta calidad. Sin embargo, este paradigma tradicional de AC muestra limitaciones al enfrentarse a tareas de razonamiento matemático complejas, principalmente debido a su fuerte dependencia de la calidad de los ejemplos y la necesidad de intervención humana en escenarios desafiantes. Para abordar estas limitaciones, este documento presenta HiAR-ICL, un paradigma de Razonamiento Automatizado de Alto Nivel en AC que cambia el enfoque de ejemplos específicos a patrones de pensamiento abstracto, ampliando el concepto convencional de contexto en AC. HiAR-ICL introduce cinco acciones de razonamiento atómico como componentes fundamentales para construir patrones estructurados en cadena. Utilizando la Búsqueda del Árbol de Monte Carlo, exploramos caminos de razonamiento y construimos tarjetas de pensamiento para guiar la inferencia posterior. Luego desarrollamos un marco de complejidad cognitiva que empareja dinámicamente problemas con tarjetas de pensamiento apropiadas. Los resultados experimentales demuestran la efectividad de HiAR-ICL, logrando una precisión de vanguardia (79.6%) en el banco de pruebas MATH con Qwen2.5-7B-Instruct, superando a GPT-4o (76.6%) y Claude 3.5 (71.1%).
English
In-context Learning (ICL) enables large language models (LLMs) to tackle
downstream tasks through sophisticated prompting and high-quality
demonstrations. However, this traditional ICL paradigm shows limitations when
facing complex mathematical reasoning tasks, primarily due to its heavy
dependence on example quality and the necessity for human intervention in
challenging scenarios. To address these limitations, this paper presents
HiAR-ICL, a High-level Automated Reasoning paradigm
in ICL that shifts focus from specific examples to abstract thinking
patterns, extending the conventional concept of context in ICL. HiAR-ICL
introduces five atomic reasoning actions as fundamental components for
constructing chain-structured patterns. Using Monte Carlo Tree Search, we
explore reasoning paths and construct thought cards to guide subsequent
inference. We then develop a cognitive complexity framework that dynamically
matches problems with appropriate thought cards. Experimental results
demonstrate HiAR-ICL's effectiveness, achieving state-of-the-art accuracy
(79.6%) on the MATH benchmark with Qwen2.5-7B-Instruct, surpassing GPT-4o
(76.6%) and Claude 3.5 (71.1%).Summary
AI-Generated Summary