PathFinder : Recherche guidée sur des chemins de raisonnement multi-étapes
PathFinder: Guided Search over Multi-Step Reasoning Paths
December 8, 2023
Auteurs: Olga Golovneva, Sean O'Brien, Ramakanth Pasunuru, Tianlu Wang, Luke Zettlemoyer, Maryam Fazel-Zarandi, Asli Celikyilmaz
cs.AI
Résumé
Avec les récents progrès des grands modèles de langage, des méthodes comme l'incitation en chaîne de pensée pour susciter des chaînes de raisonnement ont démontré leur efficacité pour améliorer les résultats sur des tâches de raisonnement. Cependant, les tâches nécessitant plusieurs étapes de raisonnement continuent de poser des défis importants aux modèles de pointe. S'inspirant de l'algorithme de recherche en faisceau, nous proposons PathFinder, une approche de génération de chemins de raisonnement basée sur la recherche arborescente. Elle améliore la diversité des branches et le raisonnement multi-sauts grâce à l'intégration d'un décodage dynamique, rendu possible par des méthodes et paramètres d'échantillonnage variés. En utilisant un raisonnement contraint, PathFinder intègre de nouvelles contraintes de qualité, des méthodes d'élagage et d'exploration pour améliorer l'efficacité et la qualité de la génération. De plus, il inclut des fonctionnalités de notation et de classement pour améliorer la sélection des candidats. Notre approche surpasse les bases de référence concurrentes sur trois tâches complexes de raisonnement arithmétique et de bon sens, avec une amélioration moyenne de 6 %. Notre modèle généralise bien à des chaînes de raisonnement plus longues et inédites, reflétant des complexités similaires à celles de la recherche en faisceau avec de grands facteurs de branchement.
English
With recent advancements in large language models, methods like
chain-of-thought prompting to elicit reasoning chains have been shown to
improve results on reasoning tasks. However, tasks that require multiple steps
of reasoning still pose significant challenges to state-of-the-art models.
Drawing inspiration from the beam search algorithm, we propose PathFinder, a
tree-search-based reasoning path generation approach. It enhances diverse
branching and multi-hop reasoning through the integration of dynamic decoding,
enabled by varying sampling methods and parameters. Using constrained
reasoning, PathFinder integrates novel quality constraints, pruning, and
exploration methods to enhance the efficiency and the quality of generation.
Moreover, it includes scoring and ranking features to improve candidate
selection. Our approach outperforms competitive baselines on three complex
arithmetic and commonsense reasoning tasks by 6% on average. Our model
generalizes well to longer, unseen reasoning chains, reflecting similar
complexities to beam search with large branching factors.