PathFinder: Ricerca Guidata su Percorsi di Ragionamento a Più Passi
PathFinder: Guided Search over Multi-Step Reasoning Paths
December 8, 2023
Autori: Olga Golovneva, Sean O'Brien, Ramakanth Pasunuru, Tianlu Wang, Luke Zettlemoyer, Maryam Fazel-Zarandi, Asli Celikyilmaz
cs.AI
Abstract
Con i recenti progressi nei modelli linguistici di grandi dimensioni, metodi come il prompting a catena di pensiero per elicitare catene di ragionamento hanno dimostrato di migliorare i risultati nei compiti di ragionamento. Tuttavia, i compiti che richiedono più passaggi di ragionamento continuano a rappresentare sfide significative per i modelli all'avanguardia. Traendo ispirazione dall'algoritmo di beam search, proponiamo PathFinder, un approccio basato sulla generazione di percorsi di ragionamento attraverso la ricerca ad albero. Esso migliora il ramificarsi diversificato e il ragionamento multi-hop attraverso l'integrazione di decodifica dinamica, abilitata da metodi e parametri di campionamento variabili. Utilizzando il ragionamento vincolato, PathFinder integra nuovi vincoli di qualità, potature e metodi di esplorazione per migliorare l'efficienza e la qualità della generazione. Inoltre, include funzionalità di punteggio e classificazione per migliorare la selezione dei candidati. Il nostro approccio supera le baseline competitive in tre complessi compiti di ragionamento aritmetico e di senso comune, con un miglioramento medio del 6%. Il nostro modello si generalizza bene a catene di ragionamento più lunghe e non viste, riflettendo complessità simili al beam search con grandi fattori di ramificazione.
English
With recent advancements in large language models, methods like
chain-of-thought prompting to elicit reasoning chains have been shown to
improve results on reasoning tasks. However, tasks that require multiple steps
of reasoning still pose significant challenges to state-of-the-art models.
Drawing inspiration from the beam search algorithm, we propose PathFinder, a
tree-search-based reasoning path generation approach. It enhances diverse
branching and multi-hop reasoning through the integration of dynamic decoding,
enabled by varying sampling methods and parameters. Using constrained
reasoning, PathFinder integrates novel quality constraints, pruning, and
exploration methods to enhance the efficiency and the quality of generation.
Moreover, it includes scoring and ranking features to improve candidate
selection. Our approach outperforms competitive baselines on three complex
arithmetic and commonsense reasoning tasks by 6% on average. Our model
generalizes well to longer, unseen reasoning chains, reflecting similar
complexities to beam search with large branching factors.