PathFinder: Búsqueda Guiada sobre Rutas de Razonamiento de Múltiples Pasos
PathFinder: Guided Search over Multi-Step Reasoning Paths
December 8, 2023
Autores: Olga Golovneva, Sean O'Brien, Ramakanth Pasunuru, Tianlu Wang, Luke Zettlemoyer, Maryam Fazel-Zarandi, Asli Celikyilmaz
cs.AI
Resumen
Con los recientes avances en los modelos de lenguaje de gran escala, métodos como el prompting de cadena de pensamiento para elicitar cadenas de razonamiento han demostrado mejorar los resultados en tareas de razonamiento. Sin embargo, las tareas que requieren múltiples pasos de razonamiento aún representan desafíos significativos para los modelos de última generación. Inspirándonos en el algoritmo de búsqueda en haz, proponemos PathFinder, un enfoque de generación de rutas de razonamiento basado en búsqueda en árbol. Este método mejora la diversidad de ramificación y el razonamiento multi-hop mediante la integración de decodificación dinámica, habilitada por métodos y parámetros de muestreo variables. Utilizando razonamiento restringido, PathFinder integra nuevas restricciones de calidad, poda y métodos de exploración para mejorar la eficiencia y la calidad de la generación. Además, incluye funciones de puntuación y clasificación para mejorar la selección de candidatos. Nuestro enfoque supera a los baselines competitivos en tres tareas complejas de razonamiento aritmético y de sentido común en un 6% en promedio. Nuestro modelo generaliza bien a cadenas de razonamiento más largas y no vistas, reflejando complejidades similares a la búsqueda en haz con grandes factores de ramificación.
English
With recent advancements in large language models, methods like
chain-of-thought prompting to elicit reasoning chains have been shown to
improve results on reasoning tasks. However, tasks that require multiple steps
of reasoning still pose significant challenges to state-of-the-art models.
Drawing inspiration from the beam search algorithm, we propose PathFinder, a
tree-search-based reasoning path generation approach. It enhances diverse
branching and multi-hop reasoning through the integration of dynamic decoding,
enabled by varying sampling methods and parameters. Using constrained
reasoning, PathFinder integrates novel quality constraints, pruning, and
exploration methods to enhance the efficiency and the quality of generation.
Moreover, it includes scoring and ranking features to improve candidate
selection. Our approach outperforms competitive baselines on three complex
arithmetic and commonsense reasoning tasks by 6% on average. Our model
generalizes well to longer, unseen reasoning chains, reflecting similar
complexities to beam search with large branching factors.