ChatPaper.aiChatPaper

SwiftSage: Ein generatives Agentensystem mit schnellem und langsamem Denken für komplexe interaktive Aufgaben

SwiftSage: A Generative Agent with Fast and Slow Thinking for Complex Interactive Tasks

May 27, 2023
Autoren: Bill Yuchen Lin, Yicheng Fu, Karina Yang, Prithviraj Ammanabrolu, Faeze Brahman, Shiyu Huang, Chandra Bhagavatula, Yejin Choi, Xiang Ren
cs.AI

Zusammenfassung

Wir stellen SwiftSage vor, ein neuartiges Agenten-Framework, das von der Dual-Prozess-Theorie der menschlichen Kognition inspiriert ist und darauf ausgelegt ist, in der Aktionsplanung für komplexe interaktive Denkaufgaben zu glänzen. SwiftSage integriert die Stärken von Behavior Cloning und dem Prompting großer Sprachmodelle (LLMs), um die Leistung bei der Aufgabenbewältigung zu verbessern. Das Framework besteht aus zwei primären Modulen: dem Swift-Modul, das schnelles und intuitives Denken repräsentiert, und dem Sage-Modul, das bewusste Denkprozesse nachahmt. Das Swift-Modul ist ein kleines Encoder-Decoder-Sprachmodell, das auf den Aktionspfaden des Oracle-Agenten feinabgestimmt ist, während das Sage-Modul LLMs wie GPT-4 für die Teilzielplanung und Verankerung einsetzt. Wir entwickeln eine heuristische Methode, um die beiden Module harmonisch zu integrieren, was zu einem effizienteren und robusteren Problemlösungsprozess führt. In 30 Aufgaben des ScienceWorld-Benchmarks übertrifft SwiftSage deutlich andere Methoden wie SayCan, ReAct und Reflexion und demonstriert damit seine Effektivität bei der Lösung komplexer realer Aufgaben.
English
We introduce SwiftSage, a novel agent framework inspired by the dual-process theory of human cognition, designed to excel in action planning for complex interactive reasoning tasks. SwiftSage integrates the strengths of behavior cloning and prompting large language models (LLMs) to enhance task completion performance. The framework comprises two primary modules: the Swift module, representing fast and intuitive thinking, and the Sage module, emulating deliberate thought processes. The Swift module is a small encoder-decoder LM fine-tuned on the oracle agent's action trajectories, while the Sage module employs LLMs such as GPT-4 for subgoal planning and grounding. We develop a heuristic method to harmoniously integrate the two modules, resulting in a more efficient and robust problem-solving process. In 30 tasks from the ScienceWorld benchmark, SwiftSage significantly outperforms other methods such as SayCan, ReAct, and Reflexion, demonstrating its effectiveness in solving complex real-world tasks.
PDF30December 15, 2024