SwiftSage: Een Generatief Agent met Snel en Langzaam Denken voor Complexe Interactieve Taken

Samenvatting

We introduceren SwiftSage, een nieuw agentframework geïnspireerd op de dual-process theorie van menselijke cognitie, ontworpen om uit te blinken in actieplanning voor complexe interactieve redeneertaken. SwiftSage integreert de sterke punten van gedragsklonen en het aansturen van grote taalmodellen (LLMs) om de taakuitvoeringsprestaties te verbeteren. Het framework bestaat uit twee primaire modules: de Swift-module, die snelle en intuïtieve denkprocessen vertegenwoordigt, en de Sage-module, die bewuste denkprocessen nabootst. De Swift-module is een klein encoder-decoder LM dat is afgestemd op de actietrajecten van de orakelagent, terwijl de Sage-module LLMs zoals GPT-4 gebruikt voor subdoelplanning en gronding. We ontwikkelen een heuristische methode om de twee modules harmonieus te integreren, wat resulteert in een efficiënter en robuuster probleemoplossingsproces. In 30 taken van de ScienceWorld-benchmark presteert SwiftSage aanzienlijk beter dan andere methoden zoals SayCan, ReAct en Reflexion, wat de effectiviteit ervan aantoont bij het oplossen van complexe real-world taken.

English

We introduce SwiftSage, a novel agent framework inspired by the dual-process theory of human cognition, designed to excel in action planning for complex interactive reasoning tasks. SwiftSage integrates the strengths of behavior cloning and prompting large language models (LLMs) to enhance task completion performance. The framework comprises two primary modules: the Swift module, representing fast and intuitive thinking, and the Sage module, emulating deliberate thought processes. The Swift module is a small encoder-decoder LM fine-tuned on the oracle agent's action trajectories, while the Sage module employs LLMs such as GPT-4 for subgoal planning and grounding. We develop a heuristic method to harmoniously integrate the two modules, resulting in a more efficient and robust problem-solving process. In 30 tasks from the ScienceWorld benchmark, SwiftSage significantly outperforms other methods such as SayCan, ReAct, and Reflexion, demonstrating its effectiveness in solving complex real-world tasks.

SwiftSage: Een Generatief Agent met Snel en Langzaam Denken voor Complexe Interactieve Taken

SwiftSage: A Generative Agent with Fast and Slow Thinking for Complex Interactive Tasks

Samenvatting

Support