Ervaring maakt vaardig: generaliseerbaar redeneren van medische agenten mogelijk maken via zelf-evoluerend vaardigheidsgeheugen

Samenvatting

Van medische agentsystemen wordt steeds vaker verwacht dat ze interactieve klinische besluitvorming ondersteunen in plaats van alleen statische vraagbeantwoording. In dergelijke omgevingen moeten effectieve agenten eerdere ervaringen hergebruiken bij evoluerende casussen, maar bestaande geheugenmechanismen bewaren vaak ruwe historische sporen die redundant, ruisachtig en moeilijk te beheren zijn. Belangrijker nog, ze maken zelden onderscheid welke herinneringen werkelijk nuttig zijn voor toekomstige redeneringen. Dit beperkt hun vermogen om compacte en betrouwbare ervaring op te bouwen voor langdurige klinische redeneringen. Om deze kloof te dichten stellen we SkeMex voor, een post-implementatie zelfevolutieframework dat medische agenten verbetert via een op vaardigheden gebaseerd geheugen zonder modelgewichten bij te werken. SkeMex distilleert informatieve interactietrajecten tot gestructureerde vaardigheden die herbruikbare procedurele kennis coderen, en organiseert ze in een multibranch-repository die algemene, taakspecifieke en actieniveau-ervaring omvat. Om te bepalen welke herinneringen hergebruikt en behouden moeten worden, schat SkeMex contextafhankelijk nut in via omgevingsfeedback en gebruikt dit om waarde-bewuste ophaling en repositorybeheer te sturen. Een gesloten cyclus van 'Lezen--Schrijven--Beoordelen--Beheren' ondersteunt verdere continue evolutie door nieuwe vaardigheden te schrijven, nut bij te werken, nuttige herinneringen te bevorderen en schadelijke items te verwijderen. Experimenten met diverse klinische taken tonen aan dat SkeMex consequent beter presteert dan representatieve geheugengebaseerde agenten in zowel offline als online omgevingen. Het generaliseert ook over modelbackbones en ondersteunt overdraagbare vaardigheidsgeheugen. Alle gegevens en code zullen openbaar worden vrijgegeven.

English

Medical agent systems are increasingly expected to support interactive clinical decision making rather than only static question answering. In such settings, effective agents must reuse prior experience across evolving cases, yet existing memory mechanisms often retain raw historical traces that are redundant, noisy, and difficult to govern. More importantly, they rarely distinguish which memories are truly useful for future reasoning. This limits their ability to accumulate compact and reliable experience for long-horizon clinical reasoning. To close this gap, we propose SkeMex, a post-deployment self-evolution framework that improves medical agents through a skill-based memory without updating model weights. SkeMex distills informative interaction trajectories into structured skills that encode reusable procedural knowledge, and organizes them into a multi-branch repository spanning general, task-specific, and action-level experience. To determine which memories should be reused and retained, SkeMex estimates context-dependent utility from environment feedback and uses it to guide value-aware retrieval and repository governance. A closed-loop ``Read--Write--Assess--Govern" lifecycle further supports continual evolution by writing new skills, updating utilities, promoting useful memories, and removing harmful entries. Experiments across diverse clinical tasks show that SkeMex consistently outperforms representative memory-based agents in both offline and online settings. It also generalizes across model backbones and supports transferable skill memory. All data and code will be released publicly.