PathFinder: Geführte Suche über mehrstufige Argumentationspfade
PathFinder: Guided Search over Multi-Step Reasoning Paths
December 8, 2023
Autoren: Olga Golovneva, Sean O'Brien, Ramakanth Pasunuru, Tianlu Wang, Luke Zettlemoyer, Maryam Fazel-Zarandi, Asli Celikyilmaz
cs.AI
Zusammenfassung
Mit den jüngsten Fortschritten bei großen Sprachmodellen haben sich Methoden wie Chain-of-Thought-Prompting, die Denkketten hervorrufen, als wirksam erwiesen, um Ergebnisse bei Aufgaben, die logisches Denken erfordern, zu verbessern. Dennoch stellen Aufgaben, die mehrere Schritte des logischen Schließens erfordern, nach wie vor erhebliche Herausforderungen für state-of-the-art Modelle dar. Inspiriert vom Beam-Search-Algorithmus schlagen wir PathFinder vor, einen auf Baum-Suche basierenden Ansatz zur Generierung von Denkpfaden. Dieser Ansatz fördert vielfältige Verzweigungen und mehrstufiges logisches Schließen durch die Integration von dynamischer Dekodierung, ermöglicht durch verschiedene Sampling-Methoden und Parameter. Durch eingeschränktes logisches Schließen integriert PathFinder neuartige Qualitätsbeschränkungen, Beschneidungs- und Erkundungsmethoden, um die Effizienz und Qualität der Generierung zu verbessern. Darüber hinaus umfasst es Bewertungs- und Rangfolgefunktionen, um die Kandidatenauswahl zu optimieren. Unser Ansatz übertrifft konkurrierende Baselines bei drei komplexen arithmetischen und alltagslogischen Denkaufgaben im Durchschnitt um 6 %. Unser Modell generalisiert gut auf längere, unbekannte Denkketten, was ähnliche Komplexitäten wie Beam Search mit großen Verzweigungsfaktoren widerspiegelt.
English
With recent advancements in large language models, methods like
chain-of-thought prompting to elicit reasoning chains have been shown to
improve results on reasoning tasks. However, tasks that require multiple steps
of reasoning still pose significant challenges to state-of-the-art models.
Drawing inspiration from the beam search algorithm, we propose PathFinder, a
tree-search-based reasoning path generation approach. It enhances diverse
branching and multi-hop reasoning through the integration of dynamic decoding,
enabled by varying sampling methods and parameters. Using constrained
reasoning, PathFinder integrates novel quality constraints, pruning, and
exploration methods to enhance the efficiency and the quality of generation.
Moreover, it includes scoring and ranking features to improve candidate
selection. Our approach outperforms competitive baselines on three complex
arithmetic and commonsense reasoning tasks by 6% on average. Our model
generalizes well to longer, unseen reasoning chains, reflecting similar
complexities to beam search with large branching factors.