A Experiência Torna Hábil: Capacitando o Raciocínio Generalizável de Agentes Médicos por Meio da Memória de Habilidades Auto-Evolutiva

Resumo

Sistemas de agentes médicos são cada vez mais esperados para apoiar a tomada de decisão clínica interativa, em vez de apenas responder perguntas de forma estática. Nesses cenários, agentes eficazes precisam reutilizar experiências anteriores em casos em evolução; no entanto, os mecanismos de memória existentes frequentemente retêm rastros históricos brutos que são redundantes, ruidosos e difíceis de controlar. Mais importante ainda, raramente distinguem quais memórias são verdadeiramente úteis para o raciocínio futuro. Isso limita sua capacidade de acumular experiências compactas e confiáveis para o raciocínio clínico de longo prazo. Para preencher essa lacuna, propomos o SkeMex, uma estrutura de autoevolução pós-implantação que melhora agentes médicos por meio de uma memória baseada em habilidades, sem atualizar os pesos do modelo. O SkeMex destila trajetórias de interação informativas em habilidades estruturadas que codificam conhecimento processual reutilizável, organizando-as em um repositório multi-ramo que abrange experiência geral, específica de tarefa e em nível de ação. Para determinar quais memórias devem ser reutilizadas e retidas, o SkeMex estima a utilidade dependente do contexto a partir do feedback do ambiente e a utiliza para orientar a recuperação ciente do valor e a governança do repositório. Um ciclo de vida em malha fechada "Ler–Escrever–Avaliar–Governar" suporta ainda a evolução contínua ao escrever novas habilidades, atualizar utilidades, promover memórias úteis e remover entradas prejudiciais. Experimentos em diversas tarefas clínicas mostram que o SkeMex supera consistentemente agentes representativos baseados em memória, tanto em contextos offline quanto online. Ele também generaliza entre backbones de modelo e suporta memória de habilidades transferível. Todos os dados e códigos serão disponibilizados publicamente.

English

Medical agent systems are increasingly expected to support interactive clinical decision making rather than only static question answering. In such settings, effective agents must reuse prior experience across evolving cases, yet existing memory mechanisms often retain raw historical traces that are redundant, noisy, and difficult to govern. More importantly, they rarely distinguish which memories are truly useful for future reasoning. This limits their ability to accumulate compact and reliable experience for long-horizon clinical reasoning. To close this gap, we propose SkeMex, a post-deployment self-evolution framework that improves medical agents through a skill-based memory without updating model weights. SkeMex distills informative interaction trajectories into structured skills that encode reusable procedural knowledge, and organizes them into a multi-branch repository spanning general, task-specific, and action-level experience. To determine which memories should be reused and retained, SkeMex estimates context-dependent utility from environment feedback and uses it to guide value-aware retrieval and repository governance. A closed-loop ``Read--Write--Assess--Govern" lifecycle further supports continual evolution by writing new skills, updating utilities, promoting useful memories, and removing harmful entries. Experiments across diverse clinical tasks show that SkeMex consistently outperforms representative memory-based agents in both offline and online settings. It also generalizes across model backbones and supports transferable skill memory. All data and code will be released publicly.