RoboMemory: Un Framework Agente a Multi-Memoria Ispirato al Cervello per l'Apprendimento Continuo nei Sistemi Fisici Embodied

Abstract

Presentiamo RoboMemory, un framework multi-memoria ispirato al cervello per l'apprendimento continuo in sistemi fisici incarnati, affrontando sfide critiche negli ambienti del mondo reale: apprendimento continuo, latenza della memoria multi-modulo, cattura delle correlazioni tra compiti e mitigazione dei loop infiniti nella pianificazione a ciclo chiuso. Basato sulle neuroscienze cognitive, integra quattro moduli principali: il Preprocessore delle Informazioni (simile al talamo), il Sistema di Memoria Incarnata a Lungo Termine (simile all'ippocampo), il Modulo di Pianificazione a Ciclo Chiuso (simile alla corteccia prefrontale) e l'Esecutore di Basso Livello (simile al cervelletto) per abilitare la pianificazione a lungo termine e l'apprendimento cumulativo. Il Sistema di Memoria Incarnata a Lungo Termine, centrale nel framework, allevia i problemi di velocità di inferenza nei framework di memoria complessi tramite aggiornamenti/recuperi paralleli tra i sottomoduli Spaziale, Temporale, Episodico e Semantico. Incorpora una Knowledge Graph (KG) dinamica e un design architettonico coerente per migliorare la consistenza e la scalabilità della memoria. Le valutazioni su EmbodiedBench mostrano che RoboMemory supera la baseline open-source (Qwen2.5-VL-72B-Ins) del 25% nella percentuale media di successo e supera lo State-of-the-Art (SOTA) closed-source (Claude3.5-Sonnet) del 5%, stabilendo un nuovo SOTA. Gli studi di ablazione convalidano i componenti chiave (critico, memoria spaziale, memoria a lungo termine), mentre il dispiegamento nel mondo reale conferma la sua capacità di apprendimento continuo con miglioramenti significativi nelle percentuali di successo su compiti ripetuti. RoboMemory allevia le sfide dell'alta latenza con scalabilità, servendo come riferimento fondamentale per l'integrazione di sistemi di memoria multi-modale nei robot fisici.

English

We present RoboMemory, a brain-inspired multi-memory framework for lifelong learning in physical embodied systems, addressing critical challenges in real-world environments: continuous learning, multi-module memory latency, task correlation capture, and infinite-loop mitigation in closed-loop planning. Grounded in cognitive neuroscience, it integrates four core modules: the Information Preprocessor (thalamus-like), the Lifelong Embodied Memory System (hippocampus-like), the Closed-Loop Planning Module (prefrontal lobe-like), and the Low-Level Executer (cerebellum-like) to enable long-term planning and cumulative learning. The Lifelong Embodied Memory System, central to the framework, alleviates inference speed issues in complex memory frameworks via parallelized updates/retrieval across Spatial, Temporal, Episodic, and Semantic submodules. It incorporates a dynamic Knowledge Graph (KG) and consistent architectural design to enhance memory consistency and scalability. Evaluations on EmbodiedBench show RoboMemory outperforms the open-source baseline (Qwen2.5-VL-72B-Ins) by 25% in average success rate and surpasses the closed-source State-of-the-Art (SOTA) (Claude3.5-Sonnet) by 5%, establishing new SOTA. Ablation studies validate key components (critic, spatial memory, long-term memory), while real-world deployment confirms its lifelong learning capability with significantly improved success rates across repeated tasks. RoboMemory alleviates high latency challenges with scalability, serving as a foundational reference for integrating multi-modal memory systems in physical robots.

RoboMemory: Un Framework Agente a Multi-Memoria Ispirato al Cervello per l'Apprendimento Continuo nei Sistemi Fisici Embodied

RoboMemory: A Brain-inspired Multi-memory Agentic Framework for Lifelong Learning in Physical Embodied Systems

Abstract

Support