STMA: Um Agente de Memória Espaço-Temporal para Planejamento de Tarefas Corporificadas de Longo Prazo
STMA: A Spatio-Temporal Memory Agent for Long-Horizon Embodied Task Planning
February 14, 2025
Autores: Mingcong Lei, Yiming Zhao, Ge Wang, Zhixin Mai, Shuguang Cui, Yatong Han, Jinke Ren
cs.AI
Resumo
Um objetivo fundamental da inteligência incorporada é capacitar agentes a realizar tarefas de longo prazo em ambientes dinâmicos, mantendo tomadas de decisão robustas e adaptabilidade. Para alcançar esse objetivo, propomos o Agente de Memória Espaço-Temporal (STMA), uma estrutura inovadora projetada para aprimorar o planejamento e a execução de tarefas por meio da integração de memória espaço-temporal. O STMA é construído com base em três componentes críticos: (1) um módulo de memória espaço-temporal que captura mudanças históricas e ambientais em tempo real, (2) um grafo de conhecimento dinâmico que facilita o raciocínio espacial adaptativo, e (3) um mecanismo planejador-crítico que refina iterativamente as estratégias de tarefas. Avaliamos o STMA no ambiente TextWorld em 32 tarefas, envolvendo planejamento multi-etapas e exploração sob diferentes níveis de complexidade. Os resultados experimentais demonstram que o STMA alcança uma melhoria de 31,25% na taxa de sucesso e um aumento de 24,7% na pontuação média em comparação com o modelo estado da arte. Os resultados destacam a eficácia da memória espaço-temporal no avanço das capacidades de memória de agentes incorporados.
English
A key objective of embodied intelligence is enabling agents to perform
long-horizon tasks in dynamic environments while maintaining robust
decision-making and adaptability. To achieve this goal, we propose the
Spatio-Temporal Memory Agent (STMA), a novel framework designed to enhance task
planning and execution by integrating spatio-temporal memory. STMA is built
upon three critical components: (1) a spatio-temporal memory module that
captures historical and environmental changes in real time, (2) a dynamic
knowledge graph that facilitates adaptive spatial reasoning, and (3) a
planner-critic mechanism that iteratively refines task strategies. We evaluate
STMA in the TextWorld environment on 32 tasks, involving multi-step planning
and exploration under varying levels of complexity. Experimental results
demonstrate that STMA achieves a 31.25% improvement in success rate and a 24.7%
increase in average score compared to the state-of-the-art model. The results
highlight the effectiveness of spatio-temporal memory in advancing the memory
capabilities of embodied agents.Summary
AI-Generated Summary