MSI-Agent: Integration von Multi-Scale-Einblicken in verkörperte Agenten für überlegene Planung und Entscheidungsfindung
MSI-Agent: Incorporating Multi-Scale Insight into Embodied Agents for Superior Planning and Decision-Making
September 25, 2024
Autoren: Dayuan Fu, Biqing Qi, Yihuai Gao, Che Jiang, Guanting Dong, Bowen Zhou
cs.AI
Zusammenfassung
Langzeitgedächtnis ist für Agenten signifikant, in dem Erkenntnisse eine entscheidende Rolle spielen. Allerdings können das Auftreten irrelevanter Erkenntnisse und der Mangel an allgemeinen Erkenntnissen die Wirksamkeit von Erkenntnissen erheblich untergraben. Um dieses Problem zu lösen, stellen wir in diesem Paper den Multi-Scale Insight Agent (MSI-Agent) vor, einen verkörperten Agenten, der entwickelt wurde, um die Planungs- und Entscheidungsfähigkeiten von LLMs durch effektive Zusammenfassung und Nutzung von Erkenntnissen über verschiedene Skalen hinweg zu verbessern. MSI erreicht dies durch den Erfahrungsselektor, den Erkenntniserzeuger und den Erkenntnisauswähler. Durch Nutzung eines dreiteiligen Prozesses kann MSI aufgabenspezifische und hochrangige Erkenntnisse generieren, diese in einer Datenbank speichern und dann relevante Erkenntnisse daraus nutzen, um bei Entscheidungen zu helfen. Unsere Experimente zeigen, dass MSI eine andere Erkenntnisstrategie bei der Planung durch GPT3.5 übertrifft. Darüber hinaus untersuchen wir die Strategien zur Auswahl von Ausgangserfahrungen und Erkenntnissen, mit dem Ziel, LLMs mehr nützliche und relevante Erkenntnisse für bessere Entscheidungsfindung bereitzustellen. Unsere Beobachtungen deuten auch darauf hin, dass MSI eine bessere Robustheit bei der Bewältigung von Szenarien mit Domänenwechsel zeigt.
English
Long-term memory is significant for agents, in which insights play a crucial
role. However, the emergence of irrelevant insight and the lack of general
insight can greatly undermine the effectiveness of insight. To solve this
problem, in this paper, we introduce Multi-Scale Insight Agent (MSI-Agent), an
embodied agent designed to improve LLMs' planning and decision-making ability
by summarizing and utilizing insight effectively across different scales. MSI
achieves this through the experience selector, insight generator, and insight
selector. Leveraging a three-part pipeline, MSI can generate task-specific and
high-level insight, store it in a database, and then use relevant insight from
it to aid in decision-making. Our experiments show that MSI outperforms another
insight strategy when planning by GPT3.5. Moreover, We delve into the
strategies for selecting seed experience and insight, aiming to provide LLM
with more useful and relevant insight for better decision-making. Our
observations also indicate that MSI exhibits better robustness when facing
domain-shifting scenarios.Summary
AI-Generated Summary