RoboMemory: Un marco agente inspirado en el cerebro con múltiples memorias para el aprendizaje continuo en sistemas físicos embebidos
RoboMemory: A Brain-inspired Multi-memory Agentic Framework for Lifelong Learning in Physical Embodied Systems
August 2, 2025
Autores: Mingcong Lei, Honghao Cai, Zezhou Cui, Liangchen Tan, Junkun Hong, Gehan Hu, Shuangyu Zhu, Yimou Wu, Shaohan Jiang, Ge Wang, Zhen Li, Shuguang Cui, Yiming Zhao, Yatong Han
cs.AI
Resumen
Presentamos RoboMemory, un marco de memoria múltiple inspirado en el cerebro para el aprendizaje continuo en sistemas físicos embebidos, abordando desafíos críticos en entornos del mundo real: aprendizaje continuo, latencia de memoria multi-módulo, captura de correlación de tareas y mitigación de bucles infinitos en planificación de circuito cerrado. Basado en la neurociencia cognitiva, integra cuatro módulos principales: el Preprocesador de Información (similar al tálamo), el Sistema de Memoria Embebida de Aprendizaje Continuo (similar al hipocampo), el Módulo de Planificación de Circuito Cerrado (similar al lóbulo prefrontal) y el Ejecutor de Bajo Nivel (similar al cerebelo) para permitir planificación a largo plazo y aprendizaje acumulativo. El Sistema de Memoria Embebida de Aprendizaje Continuo, central en el marco, alivia los problemas de velocidad de inferencia en marcos de memoria complejos mediante actualizaciones/recuperaciones paralelizadas en los submódulos Espacial, Temporal, Episódico y Semántico. Incorpora un Grafo de Conocimiento (KG) dinámico y un diseño arquitectónico consistente para mejorar la coherencia y escalabilidad de la memoria. Las evaluaciones en EmbodiedBench muestran que RoboMemory supera la línea de base de código abierto (Qwen2.5-VL-72B-Ins) en un 25% en la tasa de éxito promedio y supera el Estado del Arte (SOTA) de código cerrado (Claude3.5-Sonnet) en un 5%, estableciendo un nuevo SOTA. Los estudios de ablación validan componentes clave (crítico, memoria espacial, memoria a largo plazo), mientras que el despliegue en el mundo real confirma su capacidad de aprendizaje continuo con tasas de éxito significativamente mejoradas en tareas repetidas. RoboMemory mitiga los desafíos de alta latencia con escalabilidad, sirviendo como una referencia fundamental para la integración de sistemas de memoria multimodal en robots físicos.
English
We present RoboMemory, a brain-inspired multi-memory framework for lifelong
learning in physical embodied systems, addressing critical challenges in
real-world environments: continuous learning, multi-module memory latency, task
correlation capture, and infinite-loop mitigation in closed-loop planning.
Grounded in cognitive neuroscience, it integrates four core modules: the
Information Preprocessor (thalamus-like), the Lifelong Embodied Memory System
(hippocampus-like), the Closed-Loop Planning Module (prefrontal lobe-like), and
the Low-Level Executer (cerebellum-like) to enable long-term planning and
cumulative learning. The Lifelong Embodied Memory System, central to the
framework, alleviates inference speed issues in complex memory frameworks via
parallelized updates/retrieval across Spatial, Temporal, Episodic, and Semantic
submodules. It incorporates a dynamic Knowledge Graph (KG) and consistent
architectural design to enhance memory consistency and scalability. Evaluations
on EmbodiedBench show RoboMemory outperforms the open-source baseline
(Qwen2.5-VL-72B-Ins) by 25% in average success rate and surpasses the
closed-source State-of-the-Art (SOTA) (Claude3.5-Sonnet) by 5%, establishing
new SOTA. Ablation studies validate key components (critic, spatial memory,
long-term memory), while real-world deployment confirms its lifelong learning
capability with significantly improved success rates across repeated tasks.
RoboMemory alleviates high latency challenges with scalability, serving as a
foundational reference for integrating multi-modal memory systems in physical
robots.