메모브레인: 추론을 위한 행동 주체적 두뇌로서의 실행 메모리
MemoBrain: Executive Memory as an Agentic Brain for Reasoning
January 12, 2026
저자: Hongjin Qian, Zhao Cao, Zheng Liu
cs.AI
초록
도구 증강 에이전트 프레임워크에서의 복잡한 추론은 본질적으로 장기적 특성을 지녀, 추론 흔적과 일시적인 도구 산출물이 누적되며 대규모 언어 모델의 제한된 작업 문맥에 부하를 가합니다. 명시적인 메모리 메커니즘이 없을 경우, 이러한 누적은 논리적 연속성을 해치고 작업 정렬을 약화시킵니다. 이는 메모리를 단순한 보조적 효율성 문제가 아닌, 장기적 관점에서 일관된 목표 지향적 추론을 유지하기 위한 핵심 구성 요소로 위치 짓습니다.
본 논문에서는 도구 증강 에이전트를 위한 실행 메모리 모델인 MemoBrain을 제안합니다. MemoBrain은 추론 단계에 걸쳐 의존성 인식 메모리를 구축하여 주요 중간 상태들과 그 논리적 관계를 포착합니다. 추론 에이전트와 협력(co-pilot) 역할을 하며 MemoBrain은 실행을 차단하지 않으면서 추론 진행을 구성하고 작업 문맥을 능동적으로 관리합니다. 구체적으로, 고정된 문맥 예산 내에서 무효한 단계를 제거하고 완료된 하위 궤적을 접으며, 간결하고 높은 중요도를 지닌 추론의 중추를 보존합니다. 이러한 메커니즘들은 수동적인 문맥 누적이 아닌, 추론 궤적에 대한 명시적인 인지 제어를 가능하게 합니다.
MemoBrain을 GAIA, WebWalker, BrowseComp-Plus를 포함한 까다로운 장기 벤치마크에서 평가한 결과, 강력한 베이스라인 대비 일관된 성능 향상을 확인하였습니다.
English
Complex reasoning in tool-augmented agent frameworks is inherently long-horizon, causing reasoning traces and transient tool artifacts to accumulate and strain the bounded working context of large language models. Without explicit memory mechanisms, such accumulation disrupts logical continuity and undermines task alignment. This positions memory not as an auxiliary efficiency concern, but as a core component for sustaining coherent, goal-directed reasoning over long horizons.
We propose MemoBrain, an executive memory model for tool-augmented agents that constructs a dependency-aware memory over reasoning steps, capturing salient intermediate states and their logical relations. Operating as a co-pilot alongside the reasoning agent, MemoBrain organizes reasoning progress without blocking execution and actively manages the working context. Specifically, it prunes invalid steps, folds completed sub-trajectories, and preserves a compact, high-salience reasoning backbone under a fixed context budget. Together, these mechanisms enable explicit cognitive control over reasoning trajectories rather than passive context accumulation.
We evaluate MemoBrain on challenging long-horizon benchmarks, including GAIA, WebWalker, and BrowseComp-Plus, demonstrating consistent improvements over strong baselines.