UMEM: 범용 메모리 추출 및 관리를 위한 통합 프레임워크
UMEM: Unified Memory Extraction and Management Framework for Generalizable Memory
February 11, 2026
저자: Yongshi Ye, Hui Jiang, Feihu Jiang, Tian Lan, Yichao Du, Biao Fu, Xiaodong Shi, Qianghuai Jia, Longyue Wang, Weihua Luo
cs.AI
초록
자기 진화 메모리는 대규모 언어 모델(LLM) 기반 에이전트의 학습 가능한 매개변수 역할을 하며, 여기서 추출(경험으로부터 통찰을 추출)과 관리(메모리 저장소 업데이트)는 긴밀하게 조정되어야 합니다. 기존 방법은 주로 메모리 관리를 최적화하면서 메모리 추출을 정적 과정으로 취급하여, 에이전트가 강건한 메모리보다는 인스턴스 특이적 노이즈를 축적하는 일반화 성능 저하 문제가 발생했습니다. 이를 해결하기 위해 우리는 메모리 추출과 관리를 공동으로 최적화하는 자기 진화 에이전트 프레임워크인 UMEM(Unified Memory Extraction and Management)을 제안합니다. 특정 인스턴스에의 과적합을 완화하기 위해 의미론적 이웃 모델링을 도입하고 GRPO를 통해 이웃 수준 한계 효용 보상으로 모델을 최적화합니다. 이 접근 방식은 의미론적으로 관련된 질문 군집 전반에 걸쳐 메모리 효용성을 평가함으로써 메모리의 일반화 가능성을 보장합니다. 5개 벤치마크에서 진행한 폭넓은 실험 결과, UMEM이 경쟁력 있는 베이스라인을 크게 능가하며 다중 턴 상호작용 작업에서 최대 10.67%의 성능 향상을 달성함을 확인했습니다. 또한 UMEM은 지속적인 진화 과정에서 단조 증가 곡선을 유지합니다. 코드와 모델은 공개될 예정입니다.
English
Self-evolving memory serves as the trainable parameters for Large Language Models (LLMs)-based agents, where extraction (distilling insights from experience) and management (updating the memory bank) must be tightly coordinated. Existing methods predominately optimize memory management while treating memory extraction as a static process, resulting in poor generalization, where agents accumulate instance-specific noise rather than robust memories. To address this, we propose Unified Memory Extraction and Management (UMEM), a self-evolving agent framework that jointly optimizes a Large Language Model to simultaneous extract and manage memories. To mitigate overfitting to specific instances, we introduce Semantic Neighborhood Modeling and optimize the model with a neighborhood-level marginal utility reward via GRPO. This approach ensures memory generalizability by evaluating memory utility across clusters of semantically related queries. Extensive experiments across five benchmarks demonstrate that UMEM significantly outperforms highly competitive baselines, achieving up to a 10.67% improvement in multi-turn interactive tasks. Futhermore, UMEM maintains a monotonic growth curve during continuous evolution. Codes and models will be publicly released.