ChatPaper.aiChatPaper

AutoWebWorld: Sintesi di Ambienti Web Verificabili Infiniti tramite Macchine a Stati Finiti

AutoWebWorld: Synthesizing Infinite Verifiable Web Environments via Finite State Machines

February 15, 2026
Autori: Yifan Wu, Yiran Peng, Yiyu Chen, Jianhao Ruan, Zijie Zhuang, Cheng Yang, Jiayi Zhang, Man Chen, Yenchi Tseng, Zhaoyang Yu, Liang Chen, Yuyao Zhai, Bang Liu, Chenglin Wu, Yuyu Luo
cs.AI

Abstract

Le prestazioni degli agenti autonomi per GUI Web dipendono fortemente dalla qualità e quantità dei loro dati di addestramento. Tuttavia, persiste un collo di bottiglia fondamentale: la raccolta di traiettorie di interazione da siti web reali è costosa e difficile da verificare. Le transizioni di stato sottostanti sono nascoste, portando a una dipendenza da verificatori esterni, costosi e incoerenti, per valutare la correttezza a livello di passo. Per affrontare questo problema, proponiamo AutoWebWorld, un framework innovativo per sintetizzare ambienti web controllabili e verificabili modellandoli come Macchine a Stati Finiti (FSM) e utilizzando agenti di programmazione per tradurre le FSM in siti web interattivi. A differenza dei siti web reali, dove le transizioni di stato sono implicite, AutoWebWorld definisce esplicitamente tutti gli stati, le azioni e le regole di transizione. Ciò abilita una verifica programmatica: la correttezza delle azioni viene verificata rispetto a regole predefinite, e il successo del task è confermato dal raggiungimento di uno stato obiettivo nel grafo FSM. AutoWebWorld consente una pipeline completamente automatizzata di ricerca e verifica, generando oltre 11.663 traiettorie verificate da 29 ambienti web diversi al costo di soli 0,04$ per traiettoria. L'addestramento su questi dati sintetici migliora significativamente le prestazioni nel mondo reale. Il nostro agente Web GUI da 7B supera tutti i baseline entro 15 passi su WebVoyager. Inoltre, osserviamo una chiara legge di scala: all'aumentare del volume di dati sintetici, le prestazioni su WebVoyager e Online-Mind2Web migliorano costantemente.
English
The performance of autonomous Web GUI agents heavily relies on the quality and quantity of their training data. However, a fundamental bottleneck persists: collecting interaction trajectories from real-world websites is expensive and difficult to verify. The underlying state transitions are hidden, leading to reliance on inconsistent and costly external verifiers to evaluate step-level correctness. To address this, we propose AutoWebWorld, a novel framework for synthesizing controllable and verifiable web environments by modeling them as Finite State Machines (FSMs) and use coding agents to translate FSMs into interactive websites. Unlike real websites, where state transitions are implicit, AutoWebWorld explicitly defines all states, actions, and transition rules. This enables programmatic verification: action correctness is checked against predefined rules, and task success is confirmed by reaching a goal state in the FSM graph. AutoWebWorld enables a fully automated search-and-verify pipeline, generating over 11,663 verified trajectories from 29 diverse web environments at only $0.04 per trajectory. Training on this synthetic data significantly boosts real-world performance. Our 7B Web GUI agent outperforms all baselines within 15 steps on WebVoyager. Furthermore, we observe a clear scaling law: as the synthetic data volume increases, performance on WebVoyager and Online-Mind2Web consistently improves.
PDF512March 28, 2026