STMA: Ein räumlich-zeitliches Gedächtnisagent für langfristige verkörperte Aufgabenplanung
STMA: A Spatio-Temporal Memory Agent for Long-Horizon Embodied Task Planning
February 14, 2025
Autoren: Mingcong Lei, Yiming Zhao, Ge Wang, Zhixin Mai, Shuguang Cui, Yatong Han, Jinke Ren
cs.AI
Zusammenfassung
Ein wichtiges Ziel der verkörperten Intelligenz ist es, Agenten zu befähigen, langfristige Aufgaben in dynamischen Umgebungen auszuführen, während sie robuste Entscheidungsfindung und Anpassungsfähigkeit aufrechterhalten. Um dieses Ziel zu erreichen, schlagen wir den Spatio-Temporal Memory Agent (STMA) vor, ein neuartiges Framework, das darauf abzielt, die Aufgabenplanung und -ausführung durch die Integration von spatio-temporärem Gedächtnis zu verbessern. STMA basiert auf drei entscheidenden Komponenten: (1) ein spatio-temporales Gedächtnismodul, das historische und Umweltveränderungen in Echtzeit erfasst, (2) ein dynamischer Wissensgraph, der adaptive räumliche Schlussfolgerungen ermöglicht, und (3) ein Planer-Kritiker-Mechanismus, der iterativ Aufgabenstrategien verfeinert. Wir evaluieren STMA in der TextWorld-Umgebung anhand von 32 Aufgaben, die mehrstufige Planung und Exploration unter unterschiedlichen Komplexitätsgraden umfassen. Experimentelle Ergebnisse zeigen, dass STMA eine Verbesserung der Erfolgsquote um 31,25% und eine Steigerung des durchschnittlichen Punktwerts um 24,7% im Vergleich zum State-of-the-Art-Modell erzielt. Die Ergebnisse unterstreichen die Wirksamkeit des spatio-temporalen Gedächtnisses bei der Weiterentwicklung der Gedächtnisfähigkeiten verkörperter Agenten.
English
A key objective of embodied intelligence is enabling agents to perform
long-horizon tasks in dynamic environments while maintaining robust
decision-making and adaptability. To achieve this goal, we propose the
Spatio-Temporal Memory Agent (STMA), a novel framework designed to enhance task
planning and execution by integrating spatio-temporal memory. STMA is built
upon three critical components: (1) a spatio-temporal memory module that
captures historical and environmental changes in real time, (2) a dynamic
knowledge graph that facilitates adaptive spatial reasoning, and (3) a
planner-critic mechanism that iteratively refines task strategies. We evaluate
STMA in the TextWorld environment on 32 tasks, involving multi-step planning
and exploration under varying levels of complexity. Experimental results
demonstrate that STMA achieves a 31.25% improvement in success rate and a 24.7%
increase in average score compared to the state-of-the-art model. The results
highlight the effectiveness of spatio-temporal memory in advancing the memory
capabilities of embodied agents.Summary
AI-Generated Summary