Aanpassen van Webagents met Synthetische Supervisie
Adapting Web Agents with Synthetic Supervision
November 8, 2025
Auteurs: Zhaoyang Wang, Yiming Liang, Xuchao Zhang, Qianhui Wu, Siwei Han, Anson Bastos, Rujia Wang, Chetan Bansal, Baolin Peng, Jianfeng Gao, Saravan Rajmohan, Huaxiu Yao
cs.AI
Samenvatting
Webagents hebben moeite om zich aan te passen aan nieuwe websites vanwege de schaarste aan taak- en demonstratiespecifieke omgevingen. Recente onderzoeken hebben synthetische datageneratie verkend om deze uitdaging aan te pakken, maar zij kampen met kwaliteitsproblemen waarbij gesynthetiseerde taken hallucinaties bevatten die niet uitgevoerd kunnen worden, en verzamelde trajecten ruis bevatten met redundante of fout uitgelijnde acties. In dit artikel stellen we SynthAgent voor, een volledig synthetisch supervisiekader dat streeft naar verbetering van de synthetische datakwaliteit via dubbele verfijning van zowel taken als trajecten. Onze aanpak begint met het synthetiseren van diverse taken door gecategoriseerde verkenning van webelementen, wat een efficiënte dekking van de doelomgeving waarborgt. Tijdens de trajectverzameling verfijnen we taken wanneer conflicten met werkelijke observaties worden gedetecteerd, waardoor hallucinaties worden verminderd terwijl de taakconsistentie behouden blijft. Na de verzameling voeren we trajectverfijning uit met een globale context om mogelijke ruis of misaligneringen te mitigeren. Ten slotte fine-tunen we open-source webagents op de verfijnde synthetische gegevens om ze aan te passen aan de doelomgeving. Experimentele resultaten tonen aan dat SynthAgent bestaande synthetische datamethoden overtreft, wat het belang van hoogwaardige synthetische supervisie valideert. De code zal openbaar beschikbaar zijn op https://github.com/aiming-lab/SynthAgent.
English
Web agents struggle to adapt to new websites due to the scarcity of environment specific tasks and demonstrations. Recent works have explored synthetic data generation to address this challenge, however, they suffer from data quality issues where synthesized tasks contain hallucinations that cannot be executed, and collected trajectories are noisy with redundant or misaligned actions. In this paper, we propose SynthAgent, a fully synthetic supervision framework that aims at improving synthetic data quality via dual refinement of both tasks and trajectories. Our approach begins by synthesizing diverse tasks through categorized exploration of web elements, ensuring efficient coverage of the target environment. During trajectory collection, we refine tasks when conflicts with actual observations are detected, mitigating hallucinations while maintaining task consistency. After collection, we conduct trajectory refinement with a global context to mitigate potential noise or misalignments. Finally, we fine-tune open-source web agents on the refined synthetic data to adapt them to the target environment. Experimental results demonstrate that SynthAgent outperforms existing synthetic data methods, validating the importance of high-quality synthetic supervision. The code will be publicly available at https://github.com/aiming-lab/SynthAgent.