ChatPaper.aiChatPaper

SwiftSage : Un agent génératif doté de pensées rapide et lente pour des tâches interactives complexes

SwiftSage: A Generative Agent with Fast and Slow Thinking for Complex Interactive Tasks

May 27, 2023
Auteurs: Bill Yuchen Lin, Yicheng Fu, Karina Yang, Prithviraj Ammanabrolu, Faeze Brahman, Shiyu Huang, Chandra Bhagavatula, Yejin Choi, Xiang Ren
cs.AI

Résumé

Nous présentons SwiftSage, un nouveau cadre d'agent inspiré par la théorie du double processus de la cognition humaine, conçu pour exceller dans la planification d'actions pour des tâches complexes de raisonnement interactif. SwiftSage intègre les avantages du clonage comportemental et de l'incitation des grands modèles de langage (LLMs) pour améliorer les performances dans l'accomplissement des tâches. Le cadre comprend deux modules principaux : le module Swift, représentant une pensée rapide et intuitive, et le module Sage, imitant les processus de pensée délibérés. Le module Swift est un petit modèle de langage encodeur-décodeur affiné sur les trajectoires d'actions de l'agent oracle, tandis que le module Sage utilise des LLMs tels que GPT-4 pour la planification des sous-objectifs et leur ancrage. Nous développons une méthode heuristique pour intégrer harmonieusement les deux modules, aboutissant à un processus de résolution de problèmes plus efficace et robuste. Sur 30 tâches du benchmark ScienceWorld, SwiftSage surpasse significativement d'autres méthodes telles que SayCan, ReAct et Reflexion, démontrant son efficacité à résoudre des tâches complexes du monde réel.
English
We introduce SwiftSage, a novel agent framework inspired by the dual-process theory of human cognition, designed to excel in action planning for complex interactive reasoning tasks. SwiftSage integrates the strengths of behavior cloning and prompting large language models (LLMs) to enhance task completion performance. The framework comprises two primary modules: the Swift module, representing fast and intuitive thinking, and the Sage module, emulating deliberate thought processes. The Swift module is a small encoder-decoder LM fine-tuned on the oracle agent's action trajectories, while the Sage module employs LLMs such as GPT-4 for subgoal planning and grounding. We develop a heuristic method to harmoniously integrate the two modules, resulting in a more efficient and robust problem-solving process. In 30 tasks from the ScienceWorld benchmark, SwiftSage significantly outperforms other methods such as SayCan, ReAct, and Reflexion, demonstrating its effectiveness in solving complex real-world tasks.
PDF30December 15, 2024