Erfahrung macht geschickt: Generalisierbares Reasoning medizinischer Agenten durch selbstentwickelndes Fertigkeitsgedächtnis

Zusammenfassung

Medizinische Agentensysteme werden zunehmend dafür vorgesehen, interaktive klinische Entscheidungsfindung zu unterstützen, anstatt nur statische Fragen zu beantworten. In solchen Umgebungen müssen effektive Agenten frühere Erfahrungen über sich entwickelnde Fälle hinweg wiederverwenden, doch bestehende Gedächtnismechanismen bewahren oft rohe historische Spuren, die redundant, verrauscht und schwer zu kontrollieren sind. Noch wichtiger ist, dass sie selten unterscheiden, welche Erinnerungen für zukünftiges Denken tatsächlich nützlich sind. Dies schränkt ihre Fähigkeit ein, kompakte und zuverlässige Erfahrungen für langfristiges klinisches Denken zu sammeln. Um diese Lücke zu schließen, schlagen wir SkeMex vor, ein Post-Deployment-Selbstevolutionsframework, das medizinische Agenten durch ein fähigkeitsbasiertes Gedächtnis verbessert, ohne Modellgewichte zu aktualisieren. SkeMex destilliert informative Interaktionstrajektorien in strukturierte Fähigkeiten, die wiederverwendbares prozedurales Wissen kodieren, und organisiert sie in einem mehrzweigigen Repository, das allgemeine, aufgabenspezifische und aktionsbezogene Erfahrungen umfasst. Um zu bestimmen, welche Erinnerungen wiederverwendet und behalten werden sollen, schätzt SkeMex den kontextabhängigen Nutzen aus Umgebungsfeedback und nutzt diesen zur Steuerung eines wertbewussten Abrufs und einer Repository-Governance. Ein geschlossener Kreislauf aus "Lesen – Schreiben – Bewerten – Steuern" unterstützt die kontinuierliche Evolution, indem neue Fähigkeiten geschrieben, Nutzenwerte aktualisiert, nützliche Erinnerungen gefördert und schädliche Einträge entfernt werden. Experimente über verschiedene klinische Aufgaben hinweg zeigen, dass SkeMex repräsentative gedächtnisbasierte Agenten sowohl in Offline- als auch in Online-Umgebungen durchweg übertrifft. Es generalisiert zudem über verschiedene Modell-Backbones und unterstützt übertragbares Fähigkeitsgedächtnis. Alle Daten und der Code werden öffentlich zur Verfügung gestellt.

English

Medical agent systems are increasingly expected to support interactive clinical decision making rather than only static question answering. In such settings, effective agents must reuse prior experience across evolving cases, yet existing memory mechanisms often retain raw historical traces that are redundant, noisy, and difficult to govern. More importantly, they rarely distinguish which memories are truly useful for future reasoning. This limits their ability to accumulate compact and reliable experience for long-horizon clinical reasoning. To close this gap, we propose SkeMex, a post-deployment self-evolution framework that improves medical agents through a skill-based memory without updating model weights. SkeMex distills informative interaction trajectories into structured skills that encode reusable procedural knowledge, and organizes them into a multi-branch repository spanning general, task-specific, and action-level experience. To determine which memories should be reused and retained, SkeMex estimates context-dependent utility from environment feedback and uses it to guide value-aware retrieval and repository governance. A closed-loop ``Read--Write--Assess--Govern" lifecycle further supports continual evolution by writing new skills, updating utilities, promoting useful memories, and removing harmful entries. Experiments across diverse clinical tasks show that SkeMex consistently outperforms representative memory-based agents in both offline and online settings. It also generalizes across model backbones and supports transferable skill memory. All data and code will be released publicly.