L'expérience rend habile : permettre un raisonnement d'agent médical généralisable grâce à une mémoire de compétences auto-évolutive

Résumé

Les systèmes d'agents médicaux sont de plus en plus appelés à soutenir une prise de décision clinique interactive plutôt qu'un simple questionnement statique. Dans de tels contextes, des agents efficaces doivent réutiliser l'expérience antérieure à travers des cas en évolution, mais les mécanismes de mémoire existants conservent souvent des traces historiques brutes qui sont redondantes, bruyantes et difficiles à gouverner. Plus important encore, ils distinguent rarement quels souvenirs sont réellement utiles pour le raisonnement futur. Cela limite leur capacité à accumuler une expérience compacte et fiable pour un raisonnement clinique à long terme. Pour combler cette lacune, nous proposons SkeMex, un cadre d'auto-évolution post-déploiement qui améliore les agents médicaux via une mémoire basée sur les compétences sans mettre à jour les poids du modèle. SkeMex distille les trajectoires d'interaction informatives en compétences structurées qui encodent des connaissances procédurales réutilisables, et les organise dans un répertoire multi-branches couvrant l'expérience générale, spécifique à la tâche et au niveau des actions. Pour déterminer quels souvenirs doivent être réutilisés et conservés, SkeMex estime l'utilité dépendante du contexte à partir du retour d'information de l'environnement et l'utilise pour guider la récupération sensible à la valeur et la gouvernance du répertoire. Un cycle fermé « Lire–Écrire–Évaluer–Gouverner » soutient en outre l'évolution continue en écrivant de nouvelles compétences, en mettant à jour les utilités, en promouvant les souvenirs utiles et en supprimant les entrées nuisibles. Des expériences sur diverses tâches cliniques montrent que SkeMex surpasse systématiquement les agents basés sur la mémoire représentatifs, tant en contexte hors ligne qu'en ligne. Il se généralise également à différentes architectures de modèles et prend en charge une mémoire de compétences transférable. Toutes les données et tout le code seront rendus publics.

English

Medical agent systems are increasingly expected to support interactive clinical decision making rather than only static question answering. In such settings, effective agents must reuse prior experience across evolving cases, yet existing memory mechanisms often retain raw historical traces that are redundant, noisy, and difficult to govern. More importantly, they rarely distinguish which memories are truly useful for future reasoning. This limits their ability to accumulate compact and reliable experience for long-horizon clinical reasoning. To close this gap, we propose SkeMex, a post-deployment self-evolution framework that improves medical agents through a skill-based memory without updating model weights. SkeMex distills informative interaction trajectories into structured skills that encode reusable procedural knowledge, and organizes them into a multi-branch repository spanning general, task-specific, and action-level experience. To determine which memories should be reused and retained, SkeMex estimates context-dependent utility from environment feedback and uses it to guide value-aware retrieval and repository governance. A closed-loop ``Read--Write--Assess--Govern" lifecycle further supports continual evolution by writing new skills, updating utilities, promoting useful memories, and removing harmful entries. Experiments across diverse clinical tasks show that SkeMex consistently outperforms representative memory-based agents in both offline and online settings. It also generalizes across model backbones and supports transferable skill memory. All data and code will be released publicly.