STMA: Un Agente de Memoria Espacio-Temporal para la Planificación de Tareas Embebidas a Largo Plazo
STMA: A Spatio-Temporal Memory Agent for Long-Horizon Embodied Task Planning
February 14, 2025
Autores: Mingcong Lei, Yiming Zhao, Ge Wang, Zhixin Mai, Shuguang Cui, Yatong Han, Jinke Ren
cs.AI
Resumen
Un objetivo clave de la inteligencia encarnada es permitir que los agentes realicen tareas de largo plazo en entornos dinámicos, manteniendo una toma de decisiones robusta y adaptabilidad. Para lograr este objetivo, proponemos el Agente de Memoria Espacio-Temporal (STMA, por sus siglas en inglés), un marco novedoso diseñado para mejorar la planificación y ejecución de tareas mediante la integración de memoria espacio-temporal. STMA se basa en tres componentes críticos: (1) un módulo de memoria espacio-temporal que captura cambios históricos y ambientales en tiempo real, (2) un grafo de conocimiento dinámico que facilita el razonamiento espacial adaptativo, y (3) un mecanismo planificador-crítico que refina iterativamente las estrategias de tareas. Evaluamos STMA en el entorno TextWorld en 32 tareas, que involucran planificación de múltiples pasos y exploración bajo distintos niveles de complejidad. Los resultados experimentales demuestran que STMA logra una mejora del 31.25% en la tasa de éxito y un aumento del 24.7% en la puntuación promedio en comparación con el modelo de última generación. Los resultados destacan la efectividad de la memoria espacio-temporal para avanzar en las capacidades de memoria de los agentes encarnados.
English
A key objective of embodied intelligence is enabling agents to perform
long-horizon tasks in dynamic environments while maintaining robust
decision-making and adaptability. To achieve this goal, we propose the
Spatio-Temporal Memory Agent (STMA), a novel framework designed to enhance task
planning and execution by integrating spatio-temporal memory. STMA is built
upon three critical components: (1) a spatio-temporal memory module that
captures historical and environmental changes in real time, (2) a dynamic
knowledge graph that facilitates adaptive spatial reasoning, and (3) a
planner-critic mechanism that iteratively refines task strategies. We evaluate
STMA in the TextWorld environment on 32 tasks, involving multi-step planning
and exploration under varying levels of complexity. Experimental results
demonstrate that STMA achieves a 31.25% improvement in success rate and a 24.7%
increase in average score compared to the state-of-the-art model. The results
highlight the effectiveness of spatio-temporal memory in advancing the memory
capabilities of embodied agents.Summary
AI-Generated Summary