ChatPaper.aiChatPaper

AutoWebWorld: Síntesis de Entornos Web Infinitos Verificables mediante Máquinas de Estado Finito

AutoWebWorld: Synthesizing Infinite Verifiable Web Environments via Finite State Machines

February 15, 2026
Autores: Yifan Wu, Yiran Peng, Yiyu Chen, Jianhao Ruan, Zijie Zhuang, Cheng Yang, Jiayi Zhang, Man Chen, Yenchi Tseng, Zhaoyang Yu, Liang Chen, Yuyao Zhai, Bang Liu, Chenglin Wu, Yuyu Luo
cs.AI

Resumen

El rendimiento de los agentes autónomos de GUI web depende en gran medida de la calidad y cantidad de sus datos de entrenamiento. Sin embargo, persiste un cuello de botella fundamental: la recopilación de trayectorias de interacción de sitios web del mundo real es costosa y difícil de verificar. Las transiciones de estado subyacentes están ocultas, lo que conduce a una dependencia de verificadores externos inconsistentes y costosos para evaluar la corrección a nivel de paso. Para abordar esto, proponemos AutoWebWorld, un marco novedoso para sintetizar entornos web controlables y verificables modelándolos como Máquinas de Estado Finito (MEF) y utilizando agentes de codificación para traducir las MEF en sitios web interactivos. A diferencia de los sitios web reales, donde las transiciones de estado son implícitas, AutoWebWorld define explícitamente todos los estados, acciones y reglas de transición. Esto permite una verificación programática: la corrección de la acción se verifica frente a reglas predefinidas, y el éxito de la tarea se confirma al alcanzar un estado objetivo en el grafo de la MEF. AutoWebWorld permite una canalización automatizada de búsqueda y verificación, generando más de 11,663 trayectorias verificadas a partir de 29 entornos web diversos con un costo de solo $0.04 por trayectoria. El entrenamiento con estos datos sintéticos mejora significativamente el rendimiento en el mundo real. Nuestro agente de GUI web de 7B supera a todos los baselines en menos de 15 pasos en WebVoyager. Además, observamos una clara ley de escalamiento: a medida que aumenta el volumen de datos sintéticos, el rendimiento en WebVoyager y Online-Mind2Web mejora consistentemente.
English
The performance of autonomous Web GUI agents heavily relies on the quality and quantity of their training data. However, a fundamental bottleneck persists: collecting interaction trajectories from real-world websites is expensive and difficult to verify. The underlying state transitions are hidden, leading to reliance on inconsistent and costly external verifiers to evaluate step-level correctness. To address this, we propose AutoWebWorld, a novel framework for synthesizing controllable and verifiable web environments by modeling them as Finite State Machines (FSMs) and use coding agents to translate FSMs into interactive websites. Unlike real websites, where state transitions are implicit, AutoWebWorld explicitly defines all states, actions, and transition rules. This enables programmatic verification: action correctness is checked against predefined rules, and task success is confirmed by reaching a goal state in the FSM graph. AutoWebWorld enables a fully automated search-and-verify pipeline, generating over 11,663 verified trajectories from 29 diverse web environments at only $0.04 per trajectory. Training on this synthetic data significantly boosts real-world performance. Our 7B Web GUI agent outperforms all baselines within 15 steps on WebVoyager. Furthermore, we observe a clear scaling law: as the synthetic data volume increases, performance on WebVoyager and Online-Mind2Web consistently improves.
PDF512March 28, 2026