STMA: Un Agente de Memoria Espacio-Temporal para la Planificación de Tareas Embebidas a Largo Plazo

Resumen

Un objetivo clave de la inteligencia encarnada es permitir que los agentes realicen tareas de largo plazo en entornos dinámicos, manteniendo una toma de decisiones robusta y adaptabilidad. Para lograr este objetivo, proponemos el Agente de Memoria Espacio-Temporal (STMA, por sus siglas en inglés), un marco novedoso diseñado para mejorar la planificación y ejecución de tareas mediante la integración de memoria espacio-temporal. STMA se basa en tres componentes críticos: (1) un módulo de memoria espacio-temporal que captura cambios históricos y ambientales en tiempo real, (2) un grafo de conocimiento dinámico que facilita el razonamiento espacial adaptativo, y (3) un mecanismo planificador-crítico que refina iterativamente las estrategias de tareas. Evaluamos STMA en el entorno TextWorld en 32 tareas, que involucran planificación de múltiples pasos y exploración bajo distintos niveles de complejidad. Los resultados experimentales demuestran que STMA logra una mejora del 31.25% en la tasa de éxito y un aumento del 24.7% en la puntuación promedio en comparación con el modelo de última generación. Los resultados destacan la efectividad de la memoria espacio-temporal para avanzar en las capacidades de memoria de los agentes encarnados.

English

A key objective of embodied intelligence is enabling agents to perform long-horizon tasks in dynamic environments while maintaining robust decision-making and adaptability. To achieve this goal, we propose the Spatio-Temporal Memory Agent (STMA), a novel framework designed to enhance task planning and execution by integrating spatio-temporal memory. STMA is built upon three critical components: (1) a spatio-temporal memory module that captures historical and environmental changes in real time, (2) a dynamic knowledge graph that facilitates adaptive spatial reasoning, and (3) a planner-critic mechanism that iteratively refines task strategies. We evaluate STMA in the TextWorld environment on 32 tasks, involving multi-step planning and exploration under varying levels of complexity. Experimental results demonstrate that STMA achieves a 31.25% improvement in success rate and a 24.7% increase in average score compared to the state-of-the-art model. The results highlight the effectiveness of spatio-temporal memory in advancing the memory capabilities of embodied agents.

STMA: Un Agente de Memoria Espacio-Temporal para la Planificación de Tareas Embebidas a Largo Plazo

STMA: A Spatio-Temporal Memory Agent for Long-Horizon Embodied Task Planning

Resumen

Support