Mem0: Construindo Agentes de IA Prontos para Produção com Memória de Longo Prazo EscalávelMem0: Building Production-Ready AI Agents with Scalable Long-Term Memory
Modelos de Linguagem de Grande Escala (LLMs) demonstraram uma habilidade notável em gerar respostas contextualmente coerentes, mas suas janelas de contexto fixas apresentam desafios fundamentais para manter a consistência em diálogos prolongados e multi-sessão. Introduzimos o Mem0, uma arquitetura escalável centrada em memória que aborda essa questão ao extrair, consolidar e recuperar dinamicamente informações relevantes de conversas em andamento. Com base nessa fundação, propomos ainda uma variante aprimorada que utiliza representações de memória baseadas em grafos para capturar estruturas relacionais complexas entre elementos conversacionais. Por meio de avaliações abrangentes no benchmark LOCOMO, comparamos sistematicamente nossas abordagens contra seis categorias de baseline: (i) sistemas estabelecidos aumentados por memória, (ii) geração aumentada por recuperação (RAG) com diferentes tamanhos de fragmentos e valores de k, (iii) uma abordagem de contexto completo que processa todo o histórico da conversa, (iv) uma solução de memória de código aberto, (v) um sistema de modelo proprietário, e (vi) uma plataforma dedicada de gerenciamento de memória. Resultados empíricos mostram que nossos métodos superam consistentemente todos os sistemas de memória existentes em quatro categorias de perguntas: salto único, temporal, multi-salto e domínio aberto. Notavelmente, o Mem0 alcança uma melhoria relativa de 26% na métrica LLM-as-a-Judge em relação à OpenAI, enquanto o Mem0 com memória em grafo atinge uma pontuação geral cerca de 2% maior do que a configuração base. Além dos ganhos em precisão, também reduzimos significativamente a sobrecarga computacional em comparação com o método de contexto completo. Em particular, o Mem0 atinge uma latência p95 91% menor e economiza mais de 90% no custo de tokens, oferecendo um equilíbrio convincente entre capacidades avançadas de raciocínio e restrições práticas de implantação. Nossas descobertas destacam o papel crítico de mecanismos de memória estruturada e persistente para a coerência conversacional de longo prazo, abrindo caminho para agentes de IA impulsionados por LLMs mais confiáveis e eficientes.