合成教師データによるWebエージェントの適応 (注:タイトルは「合成的監督によるWebエージェントの適応」と訳すことも可能ですが、研究文脈では「教師データ」の方が技術的な意味合いを正確に伝えます。本文の内容に応じて最適な表現を選択してください。)
Adapting Web Agents with Synthetic Supervision
November 8, 2025
著者: Zhaoyang Wang, Yiming Liang, Xuchao Zhang, Qianhui Wu, Siwei Han, Anson Bastos, Rujia Wang, Chetan Bansal, Baolin Peng, Jianfeng Gao, Saravan Rajmohan, Huaxiu Yao
cs.AI
要旨
Webエージェントは、環境固有のタスクと実演データの不足により、新しいウェブサイトへの適応に苦戦している。近年、この課題解決に向けて合成データ生成の手法が探求されているが、生成されたタスクには実行不能な虚偽内容が含まれる、収集された軌跡には冗長や不一致の行動ノイズが混入するなど、データ品質の問題が生じている。本論文では、タスクと軌跡の二重精緻化を通じて合成データの品質向上を目指す完全合成監督フレームワーク「SynthAgent」を提案する。本手法ではまず、ウェブ要素の分類別探索を通じて多様なタスクを合成し、対象環境の効率的な網羅性を確保する。軌跡収集段階では、実際の観測値との矛盾を検出したタスクを動的に修正し、タスクの一貫性を保ちつつ虚偽内容を軽減する。収集後は大域的文脈に基づく軌跡精緻化を実施し、ノイズや不一致の可能性を低減する。最終的に、精緻化された合成データを用いてオープンソースのWebエージェントを対象環境に適応させるためファインチューニングを行う。実験結果では、SynthAgentが既存の合成データ手法を凌駕することを示し、高品質な合成監督の重要性を実証する。コードはhttps://github.com/aiming-lab/SynthAgent で公開予定である。
English
Web agents struggle to adapt to new websites due to the scarcity of environment specific tasks and demonstrations. Recent works have explored synthetic data generation to address this challenge, however, they suffer from data quality issues where synthesized tasks contain hallucinations that cannot be executed, and collected trajectories are noisy with redundant or misaligned actions. In this paper, we propose SynthAgent, a fully synthetic supervision framework that aims at improving synthetic data quality via dual refinement of both tasks and trajectories. Our approach begins by synthesizing diverse tasks through categorized exploration of web elements, ensuring efficient coverage of the target environment. During trajectory collection, we refine tasks when conflicts with actual observations are detected, mitigating hallucinations while maintaining task consistency. After collection, we conduct trajectory refinement with a global context to mitigate potential noise or misalignments. Finally, we fine-tune open-source web agents on the refined synthetic data to adapt them to the target environment. Experimental results demonstrate that SynthAgent outperforms existing synthetic data methods, validating the importance of high-quality synthetic supervision. The code will be publicly available at https://github.com/aiming-lab/SynthAgent.