Anpassung von Web-Agenten mit synthetischer Überwachung
Adapting Web Agents with Synthetic Supervision
November 8, 2025
papers.authors: Zhaoyang Wang, Yiming Liang, Xuchao Zhang, Qianhui Wu, Siwei Han, Anson Bastos, Rujia Wang, Chetan Bansal, Baolin Peng, Jianfeng Gao, Saravan Rajmohan, Huaxiu Yao
cs.AI
papers.abstract
Web-Agents haben Schwierigkeiten, sich an neue Websites anzupassen, was auf die Knappheit umgebungsspezifischer Aufgaben und Demonstrationen zurückzuführen ist. In jüngsten Arbeiten wurde die Erzeugung synthetischer Daten als Lösungsansatz untersucht; diese leiden jedoch unter Datenqualitätsproblemen, bei denen synthetisierte Aufgaben Halluzinationen enthalten, die nicht ausgeführt werden können, und gesammelte Trajektorien aufgrund redundanter oder fehlausgerichteter Aktionen verrauscht sind. In diesem Artikel stellen wir SynthAgent vor, ein vollständig synthetisches Supervision-Framework, das darauf abzielt, die Qualität synthetischer Daten durch eine duale Verfeinerung sowohl der Aufgaben als auch der Trajektorien zu verbessern. Unser Ansatz beginnt mit der Synthese vielfältiger Aufgaben durch kategorisierte Exploration von Web-Elementen, um eine effiziente Abdeckung der Zielumgebung zu gewährleisten. Während der Trajektoriensammlung verfeinern wir Aufgaben, sobald Konflikte mit tatsächlichen Beobachtungen erkannt werden, um Halluzinationen zu reduzieren und gleichzeitig die Aufgabenkonsistenz aufrechtzuerhalten. Nach der Sammlung führen wir eine Trajektorienverfeinerung mit einem globalen Kontext durch, um potenzielles Rauschen oder Fehlausrichtungen zu minimieren. Abschließend fine-tunen wir Open-Source-Web-Agents auf den verfeinerten synthetischen Daten, um sie an die Zielumgebung anzupassen. Experimentelle Ergebnisse zeigen, dass SynthAgent bestehende Methoden zur Erzeugung synthetischer Daten übertrifft und die Bedeutung hochwertiger synthetischer Supervision bestätigt. Der Code wird unter https://github.com/aiming-lab/SynthAgent öffentlich verfügbar sein.
English
Web agents struggle to adapt to new websites due to the scarcity of environment specific tasks and demonstrations. Recent works have explored synthetic data generation to address this challenge, however, they suffer from data quality issues where synthesized tasks contain hallucinations that cannot be executed, and collected trajectories are noisy with redundant or misaligned actions. In this paper, we propose SynthAgent, a fully synthetic supervision framework that aims at improving synthetic data quality via dual refinement of both tasks and trajectories. Our approach begins by synthesizing diverse tasks through categorized exploration of web elements, ensuring efficient coverage of the target environment. During trajectory collection, we refine tasks when conflicts with actual observations are detected, mitigating hallucinations while maintaining task consistency. After collection, we conduct trajectory refinement with a global context to mitigate potential noise or misalignments. Finally, we fine-tune open-source web agents on the refined synthetic data to adapt them to the target environment. Experimental results demonstrate that SynthAgent outperforms existing synthetic data methods, validating the importance of high-quality synthetic supervision. The code will be publicly available at https://github.com/aiming-lab/SynthAgent.