AutoWebWorld: Síntese de Ambientes Web Infinitos e Verificáveis por meio de Máquinas de Estados Finitos
AutoWebWorld: Synthesizing Infinite Verifiable Web Environments via Finite State Machines
February 15, 2026
Autores: Yifan Wu, Yiran Peng, Yiyu Chen, Jianhao Ruan, Zijie Zhuang, Cheng Yang, Jiayi Zhang, Man Chen, Yenchi Tseng, Zhaoyang Yu, Liang Chen, Yuyao Zhai, Bang Liu, Chenglin Wu, Yuyu Luo
cs.AI
Resumo
O desempenho dos agentes autónomos de interface gráfica web (GUI) depende fortemente da qualidade e quantidade dos seus dados de treino. No entanto, persiste um estrangulamento fundamental: a recolha de trajetórias de interação a partir de websites do mundo real é dispendiosa e difícil de verificar. As transições de estado subjacentes estão ocultas, levando à dependência de verificadores externos inconsistentes e dispendiosos para avaliar a correção a nível de cada passo. Para resolver isto, propomos o AutoWebWorld, uma nova estrutura para sintetizar ambientes web controláveis e verificáveis, modelando-os como Máquinas de Estados Finitos (FSMs) e utilizando agentes de programação para traduzir as FSMs em websites interativos. Ao contrário dos websites reais, onde as transições de estado são implícitas, o AutoWebWorld define explicitamente todos os estados, ações e regras de transição. Isto permite uma verificação programática: a correção das ações é verificada face a regras predefinidas, e o sucesso da tarefa é confirmado através da chegada a um estado objetivo no grafo da FSM. O AutoWebWorld permite um *pipeline* automatizado de pesquisa e verificação, gerando mais de 11.663 trajetórias verificadas a partir de 29 ambientes web diversos a um custo de apenas 0,04 dólares por trajetória. O treino com estes dados sintéticos aumenta significativamente o desempenho no mundo real. O nosso agente Web GUI de 7B supera todas as linhas de base dentro de 15 passos no WebVoyager. Além disso, observamos uma lei de escalonamento clara: à medida que o volume de dados sintéticos aumenta, o desempenho no WebVoyager e no Online-Mind2Web melhora consistentemente.
English
The performance of autonomous Web GUI agents heavily relies on the quality and quantity of their training data. However, a fundamental bottleneck persists: collecting interaction trajectories from real-world websites is expensive and difficult to verify. The underlying state transitions are hidden, leading to reliance on inconsistent and costly external verifiers to evaluate step-level correctness. To address this, we propose AutoWebWorld, a novel framework for synthesizing controllable and verifiable web environments by modeling them as Finite State Machines (FSMs) and use coding agents to translate FSMs into interactive websites. Unlike real websites, where state transitions are implicit, AutoWebWorld explicitly defines all states, actions, and transition rules. This enables programmatic verification: action correctness is checked against predefined rules, and task success is confirmed by reaching a goal state in the FSM graph. AutoWebWorld enables a fully automated search-and-verify pipeline, generating over 11,663 verified trajectories from 29 diverse web environments at only $0.04 per trajectory. Training on this synthetic data significantly boosts real-world performance. Our 7B Web GUI agent outperforms all baselines within 15 steps on WebVoyager. Furthermore, we observe a clear scaling law: as the synthetic data volume increases, performance on WebVoyager and Online-Mind2Web consistently improves.