Adaptación de Agentes Web con Supervisión Sintética
Adapting Web Agents with Synthetic Supervision
November 8, 2025
Autores: Zhaoyang Wang, Yiming Liang, Xuchao Zhang, Qianhui Wu, Siwei Han, Anson Bastos, Rujia Wang, Chetan Bansal, Baolin Peng, Jianfeng Gao, Saravan Rajmohan, Huaxiu Yao
cs.AI
Resumen
Los agentes web tienen dificultades para adaptarse a nuevos sitios web debido a la escasez de tareas y demostraciones específicas del entorno. Trabajos recientes han explorado la generación de datos sintéticos para abordar este desafío; sin embargo, adolecen de problemas de calidad de datos, donde las tareas sintetizadas contienen alucinaciones que no pueden ejecutarse, y las trayectorias recopiladas son ruidosas con acciones redundantes o desalineadas. En este artículo, proponemos SynthAgent, un marco de supervisión totalmente sintético que busca mejorar la calidad de los datos sintéticos mediante un refinamiento dual de tareas y trayectorias. Nuestro enfoque comienza sintetizando tareas diversas mediante una exploración categorizada de elementos web, garantizando una cobertura eficiente del entorno objetivo. Durante la recolección de trayectorias, refinamos las tareas cuando se detectan conflictos con las observaciones reales, mitigando las alucinaciones mientras se mantiene la consistencia de la tarea. Tras la recolección, realizamos un refinamiento de trayectorias con un contexto global para mitigar posibles ruidos o desalineaciones. Finalmente, ajustamos mediante fine-tuning agentes web de código abierto con los datos sintéticos refinados para adaptarlos al entorno objetivo. Los resultados experimentales demuestran que SynthAgent supera a los métodos existentes de datos sintéticos, validando la importancia de una supervisión sintética de alta calidad. El código estará disponible públicamente en https://github.com/aiming-lab/SynthAgent.
English
Web agents struggle to adapt to new websites due to the scarcity of environment specific tasks and demonstrations. Recent works have explored synthetic data generation to address this challenge, however, they suffer from data quality issues where synthesized tasks contain hallucinations that cannot be executed, and collected trajectories are noisy with redundant or misaligned actions. In this paper, we propose SynthAgent, a fully synthetic supervision framework that aims at improving synthetic data quality via dual refinement of both tasks and trajectories. Our approach begins by synthesizing diverse tasks through categorized exploration of web elements, ensuring efficient coverage of the target environment. During trajectory collection, we refine tasks when conflicts with actual observations are detected, mitigating hallucinations while maintaining task consistency. After collection, we conduct trajectory refinement with a global context to mitigate potential noise or misalignments. Finally, we fine-tune open-source web agents on the refined synthetic data to adapt them to the target environment. Experimental results demonstrate that SynthAgent outperforms existing synthetic data methods, validating the importance of high-quality synthetic supervision. The code will be publicly available at https://github.com/aiming-lab/SynthAgent.