**SuperLocalMemory V3.3: 더 리빙 브레인(The Living Brain)** - 제로-LLM 에이전트 메모리 시스템을 위한 생체 모방 망각, 인지 양자화 및 다중 채널 검색
SuperLocalMemory V3.3: The Living Brain -- Biologically-Inspired Forgetting, Cognitive Quantization, and Multi-Channel Retrieval for Zero-LLM Agent Memory Systems
April 6, 2026
저자: Varun Pratap Bhardwaj
cs.AI
초록
AI 코딩 에이전트는 역설적으로 작동합니다: 방대한 매개변수 지식을 보유하고 있으면서도 한 시간 전 대화조차 기억하지 못합니다. 기존 메모리 시스템은 단일 채널 검색 방식으로 벡터 데이터베이스에 텍스트를 저장하고, 핵심 연산을 위해 클라우드 LLM에 의존하며, 인간 기억의 효과성을 만드는 인지 과정을 전혀 구현하지 않습니다.
본 논문에서는 완전한 인지 메모리 택소노미와 수학적 생명주기 역학을 구현한 로컬-퍼스트 에이전트 메모리 시스템인 SuperLocalMemory V3.3("생생한 뇌")를 제시합니다. V3.2(arXiv:2603.14588)의 정보 기하학적 기반 위에, 우리는 다섯 가지 주요 기여를 도입합니다: (1) FRQAD(Fisher-Rao 양자화 인지 거리) — 양자화된 임베딩보다 고충실도 임베딩을 선호하는 데 있어 100% 정밀도를 달성하는 가우시안 통계 다양체 상의 새로운 메트릭(코사인 거리 대비 85.6%), 선행 기술 전무; (2) Ebbinghaus 적응형 망각 — 점진적 임베딩 압축과 결합된 로컬 에이전트 메모리 최초의 수학적 망각 곡선으로 6.7배의 판별력 달성; (3) 의미, 키워드, 엔티티 그래프, 시간, 확산 활성화, 통합, Hopfield 연관 채널을 아우르는 7채널 인지 검색으로, LLM 사용 안 하는 모드 A에서 LoCoMo 기준 70.4% 달성; (4) 소프트 프롬프트를 통한 장기 암묵 기억을 구현하는 메모리 매개변수화; (5) 완전한 메모리 생명주기를 자동화하는 마찰 제로 자동 인지 파이프라인.
LoCoMo 벤치마크에서 V3.3은 모드 A(LLM 사용 안 함)에서 70.4%를 달성했으며, 멀티홉 질의에서 +23.8%p, 적대적 질의에서 +12.7%p의 성능 향상을 보였습니다. V3.2는 모드 A 74.8%, 모드 C 87.7%를 달성했는데, 이 4.4%p 격차는 의도적인 구조적 트레이드오프를 반영합니다. SLM V3.3는 Elastic License 2.0 하에 오픈 소스이며, 완전히 CPU에서 실행되며, 월간 5,000건 이상의 다운로드를 기록하고 있습니다.
English
AI coding agents operate in a paradox: they possess vast parametric knowledge yet cannot remember a conversation from an hour ago. Existing memory systems store text in vector databases with single-channel retrieval, require cloud LLMs for core operations, and implement none of the cognitive processes that make human memory effective.
We present SuperLocalMemory V3.3 ("The Living Brain"), a local-first agent memory system implementing the full cognitive memory taxonomy with mathematical lifecycle dynamics. Building on the information-geometric foundations of V3.2 (arXiv:2603.14588), we introduce five contributions: (1) Fisher-Rao Quantization-Aware Distance (FRQAD) -- a new metric on the Gaussian statistical manifold achieving 100% precision at preferring high-fidelity embeddings over quantized ones (vs 85.6% for cosine), with zero prior art; (2) Ebbinghaus Adaptive Forgetting with lifecycle-aware quantization -- the first mathematical forgetting curve in local agent memory coupled to progressive embedding compression, achieving 6.7x discriminative power; (3) 7-channel cognitive retrieval spanning semantic, keyword, entity graph, temporal, spreading activation, consolidation, and Hopfield associative channels, achieving 70.4% on LoCoMo in zero-LLM Mode A; (4) memory parameterization implementing Long-Term Implicit memory via soft prompts; (5) zero-friction auto-cognitive pipeline automating the complete memory lifecycle.
On LoCoMo, V3.3 achieves 70.4% in Mode A (zero-LLM), with +23.8pp on multi-hop and +12.7pp on adversarial. V3.2 achieved 74.8% Mode A and 87.7% Mode C; the 4.4pp gap reflects a deliberate architectural trade-off. SLM V3.3 is open source under the Elastic License 2.0, runs entirely on CPU, with over 5,000 monthly downloads.