Опыт делает умелым: обеспечение обобщаемого рассуждения медицинского агента через саморазвивающуюся память навыков

Аннотация

Системы медицинских агентов всё чаще должны поддерживать интерактивное принятие клинических решений, а не только статическое ответы на вопросы. В таких условиях эффективные агенты должны повторно использовать предыдущий опыт в развивающихся случаях, однако существующие механизмы памяти часто сохраняют сырые исторические следы, которые избыточны, зашумлены и трудно поддаются управлению. Более того, они редко различают, какие воспоминания действительно полезны для будущих рассуждений. Это ограничивает их способность накапливать компактный и надежный опыт для долгосрочных клинических рассуждений. Для устранения этого пробела мы предлагаем SkeMex — фреймворк самоэволюции после развертывания, который улучшает медицинских агентов с помощью памяти, основанной на навыках, без обновления весов модели. SkeMex дистиллирует информативные траектории взаимодействия в структурированные навыки, кодирующие повторно используемые процедурные знания, и организует их в многопрофильное хранилище, охватывающее общий, специфический для задачи и уровень опыта на уровне действий. Чтобы определить, какие воспоминания следует повторно использовать и сохранять, SkeMex оценивает контекстно-зависимую полезность на основе обратной связи из среды и использует её для управления извлечением, учитывающим ценность, и управлением хранилищем. Замкнутый жизненный цикл «Чтение—Запись—Оценка—Управление» дополнительно поддерживает непрерывную эволюцию за счёт записи новых навыков, обновления полезности, продвижения полезных воспоминаний и удаления вредоносных записей. Эксперименты на различных клинических задачах показывают, что SkeMex последовательно превосходит репрезентативные агенты на основе памяти как в автономных, так и в онлайн-настройках. Он также обобщается на разные базовые модели и поддерживает переносимую память навыков. Все данные и код будут опубликованы в открытом доступе.

English

Medical agent systems are increasingly expected to support interactive clinical decision making rather than only static question answering. In such settings, effective agents must reuse prior experience across evolving cases, yet existing memory mechanisms often retain raw historical traces that are redundant, noisy, and difficult to govern. More importantly, they rarely distinguish which memories are truly useful for future reasoning. This limits their ability to accumulate compact and reliable experience for long-horizon clinical reasoning. To close this gap, we propose SkeMex, a post-deployment self-evolution framework that improves medical agents through a skill-based memory without updating model weights. SkeMex distills informative interaction trajectories into structured skills that encode reusable procedural knowledge, and organizes them into a multi-branch repository spanning general, task-specific, and action-level experience. To determine which memories should be reused and retained, SkeMex estimates context-dependent utility from environment feedback and uses it to guide value-aware retrieval and repository governance. A closed-loop ``Read--Write--Assess--Govern" lifecycle further supports continual evolution by writing new skills, updating utilities, promoting useful memories, and removing harmful entries. Experiments across diverse clinical tasks show that SkeMex consistently outperforms representative memory-based agents in both offline and online settings. It also generalizes across model backbones and supports transferable skill memory. All data and code will be released publicly.