PathFinder: Ricerca Guidata su Percorsi di Ragionamento a Più Passi

Abstract

Con i recenti progressi nei modelli linguistici di grandi dimensioni, metodi come il prompting a catena di pensiero per elicitare catene di ragionamento hanno dimostrato di migliorare i risultati nei compiti di ragionamento. Tuttavia, i compiti che richiedono più passaggi di ragionamento continuano a rappresentare sfide significative per i modelli all'avanguardia. Traendo ispirazione dall'algoritmo di beam search, proponiamo PathFinder, un approccio basato sulla generazione di percorsi di ragionamento attraverso la ricerca ad albero. Esso migliora il ramificarsi diversificato e il ragionamento multi-hop attraverso l'integrazione di decodifica dinamica, abilitata da metodi e parametri di campionamento variabili. Utilizzando il ragionamento vincolato, PathFinder integra nuovi vincoli di qualità, potature e metodi di esplorazione per migliorare l'efficienza e la qualità della generazione. Inoltre, include funzionalità di punteggio e classificazione per migliorare la selezione dei candidati. Il nostro approccio supera le baseline competitive in tre complessi compiti di ragionamento aritmetico e di senso comune, con un miglioramento medio del 6%. Il nostro modello si generalizza bene a catene di ragionamento più lunghe e non viste, riflettendo complessità simili al beam search con grandi fattori di ramificazione.

English

With recent advancements in large language models, methods like chain-of-thought prompting to elicit reasoning chains have been shown to improve results on reasoning tasks. However, tasks that require multiple steps of reasoning still pose significant challenges to state-of-the-art models. Drawing inspiration from the beam search algorithm, we propose PathFinder, a tree-search-based reasoning path generation approach. It enhances diverse branching and multi-hop reasoning through the integration of dynamic decoding, enabled by varying sampling methods and parameters. Using constrained reasoning, PathFinder integrates novel quality constraints, pruning, and exploration methods to enhance the efficiency and the quality of generation. Moreover, it includes scoring and ranking features to improve candidate selection. Our approach outperforms competitive baselines on three complex arithmetic and commonsense reasoning tasks by 6% on average. Our model generalizes well to longer, unseen reasoning chains, reflecting similar complexities to beam search with large branching factors.

PathFinder: Ricerca Guidata su Percorsi di Ragionamento a Più Passi

PathFinder: Guided Search over Multi-Step Reasoning Paths

Abstract

Support