SkillWeaver: Web-Agenten können sich selbst verbessern, indem sie Fähigkeiten entdecken und verfeinern
SkillWeaver: Web Agents can Self-Improve by Discovering and Honing Skills
April 9, 2025
Autoren: Boyuan Zheng, Michael Y. Fatemi, Xiaolong Jin, Zora Zhiruo Wang, Apurva Gandhi, Yueqi Song, Yu Gu, Jayanth Srinivasa, Gaowen Liu, Graham Neubig, Yu Su
cs.AI
Zusammenfassung
Um in komplexen Umgebungen zu überleben und zu gedeihen, haben Menschen ausgeklügelte Selbstverbesserungsmechanismen entwickelt, die auf der Erkundung der Umgebung, der hierarchischen Abstraktion von Erfahrungen in wiederverwendbare Fähigkeiten und der gemeinschaftlichen Konstruktion eines stetig wachsenden Fähigkeitsrepertoires basieren. Trotz jüngster Fortschritte mangelt es autonomen Web-Agenten immer noch an entscheidenden Selbstverbesserungsfähigkeiten, insbesondere bei der Abstraktion von prozeduralem Wissen, der Verfeinerung von Fähigkeiten und der Komposition von Fähigkeiten. In dieser Arbeit stellen wir SkillWeaver vor, ein fähigkeitszentriertes Framework, das es Agenten ermöglicht, sich selbst zu verbessern, indem sie autonom wiederverwendbare Fähigkeiten als APIs synthetisieren. Bei einer neuen Website entdeckt der Agent autonom Fähigkeiten, führt sie zur Übung aus und destilliert die Übungserfahrungen in robuste APIs. Iterative Erkundung erweitert kontinuierlich eine Bibliothek von leichtgewichtigen, Plug-and-Play-APIs, die die Fähigkeiten des Agenten erheblich verbessern. Experimente auf WebArena und realen Websites demonstrieren die Wirksamkeit von SkillWeaver mit relativen Erfolgsratenverbesserungen von 31,8 % bzw. 39,8 %. Darüber hinaus verbessern APIs, die von starken Agenten synthetisiert werden, schwächere Agenten durch übertragbare Fähigkeiten erheblich, was Verbesserungen von bis zu 54,3 % auf WebArena erzielt. Diese Ergebnisse zeigen die Effektivität der Verfeinerung verschiedener Website-Interaktionen in APIs, die nahtlos zwischen verschiedenen Web-Agenten geteilt werden können.
English
To survive and thrive in complex environments, humans have evolved
sophisticated self-improvement mechanisms through environment exploration,
hierarchical abstraction of experiences into reuseable skills, and
collaborative construction of an ever-growing skill repertoire. Despite recent
advancements, autonomous web agents still lack crucial self-improvement
capabilities, struggling with procedural knowledge abstraction, refining
skills, and skill composition. In this work, we introduce SkillWeaver, a
skill-centric framework enabling agents to self-improve by autonomously
synthesizing reusable skills as APIs. Given a new website, the agent
autonomously discovers skills, executes them for practice, and distills
practice experiences into robust APIs. Iterative exploration continually
expands a library of lightweight, plug-and-play APIs, significantly enhancing
the agent's capabilities. Experiments on WebArena and real-world websites
demonstrate the efficacy of SkillWeaver, achieving relative success rate
improvements of 31.8% and 39.8%, respectively. Additionally, APIs synthesized
by strong agents substantially enhance weaker agents through transferable
skills, yielding improvements of up to 54.3% on WebArena. These results
demonstrate the effectiveness of honing diverse website interactions into APIs,
which can be seamlessly shared among various web agents.Summary
AI-Generated Summary