ChatPaper.aiChatPaper

HDFlow: Verbesserung der komplexen Problemlösung von LLM durch hybrides Denken und dynamische Workflows

HDFlow: Enhancing LLM Complex Problem-Solving with Hybrid Thinking and Dynamic Workflows

September 25, 2024
Autoren: Wenlin Yao, Haitao Mi, Dong Yu
cs.AI

Zusammenfassung

Trotz der jüngsten Fortschritte bei großen Sprachmodellen (LLMs) ist ihre Leistung bei komplexen Problemen des Denkens in mehreren Schritten und der Kombination verschiedener Fähigkeiten immer noch begrenzt. Um dies anzugehen, schlagen wir ein neuartiges Framework namens HDFlow für komplexes Denken mit LLMs vor, das schnelle und langsame Denkmodi auf adaptive Weise kombiniert. Unser Ansatz besteht aus zwei Schlüsselkomponenten: 1) ein neuer Ansatz für langsames, überlegtes Denken namens Dynamischer Workflow, der komplexe Probleme automatisch in handlichere Teilaufgaben zerlegt und dynamisch einen Workflow entwirft, um spezialisierte LLMs oder symbolische Denkwerkzeuge zur Lösung von Teilaufgaben zusammenzustellen; 2) Hybriddenken, ein allgemeines Framework, das schnelles und langsames Denken basierend auf der Problemkomplexität dynamisch kombiniert. Schließlich schlagen wir eine leicht skalierbare Methode zur automatischen Synthese eines groß angelegten Datensatzes von 27K herausfordernden Denkproblemen für komplexes Denken und eine Hybriddenk-Abstimmungsmethode vor, die kleinere LLMs auf diesem Datensatz trainiert, um die Hybrid-Denkstrategien für schnelles/langsames Denken zu internalisieren. Experimente mit vier Denk-Benchmark-Datensätzen zeigen, dass unser langsames Denken mit dynamischen Workflows signifikant besser abschneidet als Chain-of-Thought, und das Hybriddenken die höchste Genauigkeit erreicht, während es ein effektives Gleichgewicht zwischen Recheneffizienz und Leistung bietet. Das Feintuning mit unserem Hybriddenkansatz steigert auch signifikant die Fähigkeiten des komplexen Denkens von Open-Source-Sprachmodellen. Die Ergebnisse zeigen das Potenzial von langsamen Denken, dynamischen Workflows und Hybriddenken bei der Erweiterung der Grenzen der komplexen Problemlösung mit LLMs. Code und Daten werden unter \url{https://github.com/wenlinyao/HDFlow.} veröffentlicht.
English
Despite recent advancements in large language models (LLMs), their performance on complex reasoning problems requiring multi-step thinking and combining various skills is still limited. To address this, we propose a novel framework HDFlow for complex reasoning with LLMs that combines fast and slow thinking modes in an adaptive manner. Our approach consists of two key components: 1) a new approach for slow, deliberate reasoning called Dynamic Workflow, which automatically decomposes complex problems into more manageable sub-tasks and dynamically designs a workflow to assemble specialized LLM or symbolic reasoning tools to solve sub-tasks; 2) Hybrid Thinking, a general framework that dynamically combines fast and slow thinking based on problem complexity. Finally, we propose an easy-to-scale method for automatically synthesizing a large-scale dataset of 27K challenging reasoning problems for complex reasoning and a hybrid thinking tuning method that trains smaller LLMs on this dataset to internalize the fast/slow hybrid reasoning strategies. Experiments on four reasoning benchmark datasets demonstrate that our slow thinking with dynamic workflows significantly outperforms Chain-of-Thought, and hybrid thinking achieves the highest accuracy while providing an effective balance between computational efficiency and performance. Fine-tuning using our hybrid thinking approach also significantly boosts the complex reasoning capabilities of open-source language models. The results showcase the promise of slow thinking, dynamic workflows, and hybrid thinking in expanding the frontier of complex problem-solving with LLMsCode and data will be released at \url{https://github.com/wenlinyao/HDFlow.}.

Summary

AI-Generated Summary

PDF92November 16, 2024