RoboMemory: Многоуровневая агентная структура, вдохновленная мозгом, для непрерывного обучения в физических воплощенных системах

Аннотация

Мы представляем RoboMemory — вдохновленную мозгом многомодульную систему памяти для непрерывного обучения в физических воплощенных системах, решающую ключевые задачи в реальных условиях: непрерывное обучение, задержки в работе многомодульной памяти, захват корреляций между задачами и предотвращение бесконечных циклов в замкнутом планировании. Основанная на когнитивной нейронауке, система интегрирует четыре основных модуля: Предобработчик информации (таламусоподобный), Система непрерывной воплощенной памяти (гиппокампоподобная), Модуль замкнутого планирования (префронтальная доля) и Низкоуровневый исполнитель (мозжечкоподобный) для обеспечения долгосрочного планирования и накопительного обучения. Система непрерывной воплощенной памяти, являющаяся центральным элементом фреймворка, устраняет проблемы скорости вывода в сложных системах памяти за счет параллелизированных обновлений и извлечения данных в пространственных, временных, эпизодических и семантических подмодулях. Она включает динамический Граф знаний (Knowledge Graph, KG) и единообразный архитектурный дизайн для повышения согласованности и масштабируемости памяти. Оценки на EmbodiedBench показывают, что RoboMemory превосходит открытый базовый уровень (Qwen2.5-VL-72B-Ins) на 25% по средней успешности и опережает закрытый State-of-the-Art (SOTA) (Claude3.5-Sonnet) на 5%, устанавливая новый SOTA. Абляционные исследования подтверждают важность ключевых компонентов (критика, пространственной памяти, долговременной памяти), а реальное развертывание подтверждает способность к непрерывному обучению с существенным улучшением успешности при повторяющихся задачах. RoboMemory решает проблемы высокой задержки с учетом масштабируемости, служа фундаментальным ориентиром для интеграции многомодальных систем памяти в физических роботах.

English

We present RoboMemory, a brain-inspired multi-memory framework for lifelong learning in physical embodied systems, addressing critical challenges in real-world environments: continuous learning, multi-module memory latency, task correlation capture, and infinite-loop mitigation in closed-loop planning. Grounded in cognitive neuroscience, it integrates four core modules: the Information Preprocessor (thalamus-like), the Lifelong Embodied Memory System (hippocampus-like), the Closed-Loop Planning Module (prefrontal lobe-like), and the Low-Level Executer (cerebellum-like) to enable long-term planning and cumulative learning. The Lifelong Embodied Memory System, central to the framework, alleviates inference speed issues in complex memory frameworks via parallelized updates/retrieval across Spatial, Temporal, Episodic, and Semantic submodules. It incorporates a dynamic Knowledge Graph (KG) and consistent architectural design to enhance memory consistency and scalability. Evaluations on EmbodiedBench show RoboMemory outperforms the open-source baseline (Qwen2.5-VL-72B-Ins) by 25% in average success rate and surpasses the closed-source State-of-the-Art (SOTA) (Claude3.5-Sonnet) by 5%, establishing new SOTA. Ablation studies validate key components (critic, spatial memory, long-term memory), while real-world deployment confirms its lifelong learning capability with significantly improved success rates across repeated tasks. RoboMemory alleviates high latency challenges with scalability, serving as a foundational reference for integrating multi-modal memory systems in physical robots.

RoboMemory: Многоуровневая агентная структура, вдохновленная мозгом, для непрерывного обучения в физических воплощенных системах

RoboMemory: A Brain-inspired Multi-memory Agentic Framework for Lifelong Learning in Physical Embodied Systems

Аннотация

Support