STMA: Een Spatio-Temporeel Geheugenagent voor Langetermijn Taakplanning in Geëmbodieerde Systemen
STMA: A Spatio-Temporal Memory Agent for Long-Horizon Embodied Task Planning
February 14, 2025
Auteurs: Mingcong Lei, Yiming Zhao, Ge Wang, Zhixin Mai, Shuguang Cui, Yatong Han, Jinke Ren
cs.AI
Samenvatting
Een belangrijk doel van belichaamde intelligentie is het in staat stellen van agents om langetermijntaken uit te voeren in dynamische omgevingen, terwijl robuuste besluitvorming en aanpassingsvermogen behouden blijven. Om dit doel te bereiken, stellen we de Spatio-Temporele Geheugen Agent (STMA) voor, een nieuw raamwerk ontworpen om taakplanning en -uitvoering te verbeteren door spatio-temporeel geheugen te integreren. STMA is gebaseerd op drie cruciale componenten: (1) een spatio-temporele geheugenmodule die historische en omgevingsveranderingen in realtime vastlegt, (2) een dynamische kennisgrafiek die adaptief ruimtelijk redeneren mogelijk maakt, en (3) een planner-critic-mechanisme dat taakstrategieën iteratief verfijnt. We evalueren STMA in de TextWorld-omgeving op 32 taken, waarbij multi-stappenplanning en exploratie onder verschillende complexiteitsniveaus betrokken zijn. Experimentele resultaten tonen aan dat STMA een verbetering van 31,25% in succespercentage en een toename van 24,7% in gemiddelde score behaalt in vergelijking met het state-of-the-art model. De resultaten benadrukken de effectiviteit van spatio-temporeel geheugen bij het verbeteren van de geheugencapaciteiten van belichaamde agents.
English
A key objective of embodied intelligence is enabling agents to perform
long-horizon tasks in dynamic environments while maintaining robust
decision-making and adaptability. To achieve this goal, we propose the
Spatio-Temporal Memory Agent (STMA), a novel framework designed to enhance task
planning and execution by integrating spatio-temporal memory. STMA is built
upon three critical components: (1) a spatio-temporal memory module that
captures historical and environmental changes in real time, (2) a dynamic
knowledge graph that facilitates adaptive spatial reasoning, and (3) a
planner-critic mechanism that iteratively refines task strategies. We evaluate
STMA in the TextWorld environment on 32 tasks, involving multi-step planning
and exploration under varying levels of complexity. Experimental results
demonstrate that STMA achieves a 31.25% improvement in success rate and a 24.7%
increase in average score compared to the state-of-the-art model. The results
highlight the effectiveness of spatio-temporal memory in advancing the memory
capabilities of embodied agents.Summary
AI-Generated Summary