SkillWeaver : Les agents web peuvent s'améliorer par la découverte et l'affinement de compétences
SkillWeaver: Web Agents can Self-Improve by Discovering and Honing Skills
April 9, 2025
Auteurs: Boyuan Zheng, Michael Y. Fatemi, Xiaolong Jin, Zora Zhiruo Wang, Apurva Gandhi, Yueqi Song, Yu Gu, Jayanth Srinivasa, Gaowen Liu, Graham Neubig, Yu Su
cs.AI
Résumé
Pour survivre et prospérer dans des environnements complexes, les humains ont développé des mécanismes sophistiqués d'auto-amélioration grâce à l'exploration de leur environnement, à l'abstraction hiérarchique des expériences en compétences réutilisables, et à la construction collaborative d'un répertoire de compétences en constante expansion. Malgré les avancées récentes, les agents web autonomes manquent encore de capacités cruciales d'auto-amélioration, peinant à abstraire les connaissances procédurales, à affiner leurs compétences et à les composer. Dans ce travail, nous présentons SkillWeaver, un framework centré sur les compétences permettant aux agents de s'auto-améliorer en synthétisant de manière autonome des compétences réutilisables sous forme d'API. Face à un nouveau site web, l'agent découvre de manière autonome des compétences, les exécute pour s'entraîner, et distille les expériences d'entraînement en API robustes. Une exploration itérative élargit continuellement une bibliothèque d'API légères et prêtes à l'emploi, améliorant significativement les capacités de l'agent. Les expériences sur WebArena et des sites web réels démontrent l'efficacité de SkillWeaver, avec des améliorations relatives des taux de réussite de 31,8 % et 39,8 %, respectivement. De plus, les API synthétisées par des agents performants améliorent considérablement les agents moins performants grâce à des compétences transférables, entraînant des améliorations allant jusqu'à 54,3 % sur WebArena. Ces résultats montrent l'efficacité de l'affinement des interactions variées avec les sites web en API, qui peuvent être partagées de manière transparente entre différents agents web.
English
To survive and thrive in complex environments, humans have evolved
sophisticated self-improvement mechanisms through environment exploration,
hierarchical abstraction of experiences into reuseable skills, and
collaborative construction of an ever-growing skill repertoire. Despite recent
advancements, autonomous web agents still lack crucial self-improvement
capabilities, struggling with procedural knowledge abstraction, refining
skills, and skill composition. In this work, we introduce SkillWeaver, a
skill-centric framework enabling agents to self-improve by autonomously
synthesizing reusable skills as APIs. Given a new website, the agent
autonomously discovers skills, executes them for practice, and distills
practice experiences into robust APIs. Iterative exploration continually
expands a library of lightweight, plug-and-play APIs, significantly enhancing
the agent's capabilities. Experiments on WebArena and real-world websites
demonstrate the efficacy of SkillWeaver, achieving relative success rate
improvements of 31.8% and 39.8%, respectively. Additionally, APIs synthesized
by strong agents substantially enhance weaker agents through transferable
skills, yielding improvements of up to 54.3% on WebArena. These results
demonstrate the effectiveness of honing diverse website interactions into APIs,
which can be seamlessly shared among various web agents.Summary
AI-Generated Summary