Адаптация веб-агентов с использованием синтетического обучения
Adapting Web Agents with Synthetic Supervision
November 8, 2025
Авторы: Zhaoyang Wang, Yiming Liang, Xuchao Zhang, Qianhui Wu, Siwei Han, Anson Bastos, Rujia Wang, Chetan Bansal, Baolin Peng, Jianfeng Gao, Saravan Rajmohan, Huaxiu Yao
cs.AI
Аннотация
Веб-агенты сталкиваются с трудностями при адаптации к новым веб-сайтам из-за недостатка задач и демонстраций, специфичных для конкретной среды. В последних работах исследуется генерация синтетических данных для решения этой проблемы, однако они страдают от проблем с качеством данных: синтезированные задачи содержат галлюцинации, которые невозможно выполнить, а собранные траектории зашумлены избыточными или несогласованными действиями. В данной статье мы предлагаем SynthAgent — полностью синтетическую систему управления, направленную на повышение качества синтетических данных за счет двойного уточнения как задач, так и траекторий. Наш подход начинается с синтеза разнообразных задач через категоризированное исследование веб-элементов, что обеспечивает эффективное покрытие целевой среды. В процессе сбора траекторий мы уточняем задачи при обнаружении конфликтов с реальными наблюдениями, уменьшая галлюцинации при сохранении согласованности задачи. После сбора мы проводим уточнение траекторий с учетом глобального контекста, чтобы уменьшить потенциальный шум или рассогласования. Наконец, мы дообучаем веб-агенты с открытым исходным кодом на уточненных синтетических данных, чтобы адаптировать их к целевой среде. Результаты экспериментов показывают, что SynthAgent превосходит существующие методы работы с синтетическими данными, подтверждая важность высококачественного синтетического управления. Код будет общедоступен по адресу https://github.com/aiming-lab/SynthAgent.
English
Web agents struggle to adapt to new websites due to the scarcity of environment specific tasks and demonstrations. Recent works have explored synthetic data generation to address this challenge, however, they suffer from data quality issues where synthesized tasks contain hallucinations that cannot be executed, and collected trajectories are noisy with redundant or misaligned actions. In this paper, we propose SynthAgent, a fully synthetic supervision framework that aims at improving synthetic data quality via dual refinement of both tasks and trajectories. Our approach begins by synthesizing diverse tasks through categorized exploration of web elements, ensuring efficient coverage of the target environment. During trajectory collection, we refine tasks when conflicts with actual observations are detected, mitigating hallucinations while maintaining task consistency. After collection, we conduct trajectory refinement with a global context to mitigate potential noise or misalignments. Finally, we fine-tune open-source web agents on the refined synthetic data to adapt them to the target environment. Experimental results demonstrate that SynthAgent outperforms existing synthetic data methods, validating the importance of high-quality synthetic supervision. The code will be publicly available at https://github.com/aiming-lab/SynthAgent.