RoboMemory: Um Framework Agente de Múltiplas Memórias Inspirado no Cérebro para Aprendizado Contínuo em Sistemas Embarcados Físicos
RoboMemory: A Brain-inspired Multi-memory Agentic Framework for Lifelong Learning in Physical Embodied Systems
August 2, 2025
Autores: Mingcong Lei, Honghao Cai, Zezhou Cui, Liangchen Tan, Junkun Hong, Gehan Hu, Shuangyu Zhu, Yimou Wu, Shaohan Jiang, Ge Wang, Zhen Li, Shuguang Cui, Yiming Zhao, Yatong Han
cs.AI
Resumo
Apresentamos o RoboMemory, uma estrutura de memória múltipla inspirada no cérebro para aprendizado contínuo em sistemas físicos incorporados, abordando desafios críticos em ambientes do mundo real: aprendizado contínuo, latência de memória multi-módulo, captura de correlação de tarefas e mitigação de loops infinitos no planejamento em circuito fechado. Baseado na neurociência cognitiva, ele integra quatro módulos principais: o Pré-processador de Informações (semelhante ao tálamo), o Sistema de Memória Incorporada Contínua (semelhante ao hipocampo), o Módulo de Planejamento em Circuito Fechado (semelhante ao lobo pré-frontal) e o Executor de Baixo Nível (semelhante ao cerebelo) para permitir planejamento de longo prazo e aprendizado cumulativo. O Sistema de Memória Incorporada Contínua, central na estrutura, alivia problemas de velocidade de inferência em estruturas de memória complexas por meio de atualizações/recuperações paralelizadas entre sub-módulos Espacial, Temporal, Episódico e Semântico. Ele incorpora um Grafo de Conhecimento (KG) dinâmico e um design arquitetônico consistente para melhorar a consistência e escalabilidade da memória. Avaliações no EmbodiedBench mostram que o RoboMemory supera a linha de base de código aberto (Qwen2.5-VL-72B-Ins) em 25% na taxa média de sucesso e ultrapassa o State-of-the-Art (SOTA) de código fechado (Claude3.5-Sonnet) em 5%, estabelecendo um novo SOTA. Estudos de ablação validam componentes-chave (crítico, memória espacial, memória de longo prazo), enquanto a implantação no mundo real confirma sua capacidade de aprendizado contínuo com taxas de sucesso significativamente melhoradas em tarefas repetidas. O RoboMemory alivia desafios de alta latência com escalabilidade, servindo como uma referência fundamental para a integração de sistemas de memória multimodal em robôs físicos.
English
We present RoboMemory, a brain-inspired multi-memory framework for lifelong
learning in physical embodied systems, addressing critical challenges in
real-world environments: continuous learning, multi-module memory latency, task
correlation capture, and infinite-loop mitigation in closed-loop planning.
Grounded in cognitive neuroscience, it integrates four core modules: the
Information Preprocessor (thalamus-like), the Lifelong Embodied Memory System
(hippocampus-like), the Closed-Loop Planning Module (prefrontal lobe-like), and
the Low-Level Executer (cerebellum-like) to enable long-term planning and
cumulative learning. The Lifelong Embodied Memory System, central to the
framework, alleviates inference speed issues in complex memory frameworks via
parallelized updates/retrieval across Spatial, Temporal, Episodic, and Semantic
submodules. It incorporates a dynamic Knowledge Graph (KG) and consistent
architectural design to enhance memory consistency and scalability. Evaluations
on EmbodiedBench show RoboMemory outperforms the open-source baseline
(Qwen2.5-VL-72B-Ins) by 25% in average success rate and surpasses the
closed-source State-of-the-Art (SOTA) (Claude3.5-Sonnet) by 5%, establishing
new SOTA. Ablation studies validate key components (critic, spatial memory,
long-term memory), while real-world deployment confirms its lifelong learning
capability with significantly improved success rates across repeated tasks.
RoboMemory alleviates high latency challenges with scalability, serving as a
foundational reference for integrating multi-modal memory systems in physical
robots.