AutoWebWorld: Synthetiseren van Oneindige Verifieerbare Webomgevingen via Eindige Toestandsautomaten
AutoWebWorld: Synthesizing Infinite Verifiable Web Environments via Finite State Machines
February 15, 2026
Auteurs: Yifan Wu, Yiran Peng, Yiyu Chen, Jianhao Ruan, Zijie Zhuang, Cheng Yang, Jiayi Zhang, Man Chen, Yenchi Tseng, Zhaoyang Yu, Liang Chen, Yuyao Zhai, Bang Liu, Chenglin Wu, Yuyu Luo
cs.AI
Samenvatting
De prestaties van autonome Web GUI-agenten zijn sterk afhankelijk van de kwaliteit en hoeveelheid van hun trainingsdata. Er blijft echter een fundamenteel knelpunt bestaan: het verzamelen van interactietrajecten van echte websites is kostbaar en moeilijk te verifiëren. De onderliggende toestandsovergangen zijn verborgen, wat leidt tot een afhankelijkheid van inconsistente en kostbare externe verificatiemiddelen om de correctheid op stapniveau te evalueren. Om dit aan te pakken, stellen we AutoWebWorld voor, een nieuw raamwerk voor het synthetiseren van controleerbare en verifieerbare webomgevingen door ze te modelleren als eindige toestandsautomaten (FSM's) en codeeragenten te gebruiken om FSM's om te zetten in interactieve websites. In tegenstelling tot echte websites, waar toestandsovergangen impliciet zijn, definieert AutoWebWorld expliciet alle toestanden, acties en overgangsregels. Dit maakt programmatische verificatie mogelijk: de correctheid van acties wordt gecontroleerd aan de hand van vooraf gedefinieerde regels, en taaksucces wordt bevestigd door het bereiken van een doeltoestand in de FSM-grafiek. AutoWebWorld maakt een volledig geautomatiseerde zoek-en-verifieer-pijplijn mogelijk, die meer dan 11.663 geverifieerde trajecten genereert uit 29 diverse webomgevingen tegen slechts $0,04 per traject. Training op deze synthetische data verbetert de prestaties in de echte wereld aanzienlijk. Onze 7B Web GUI-agent presteert beter dan alle baseline-methoden binnen 15 stappen op WebVoyager. Verder observeren we een duidelijke schaalwet: naarmate het volume aan synthetische data toeneemt, verbetert de prestatie op WebVoyager en Online-Mind2Web consistent.
English
The performance of autonomous Web GUI agents heavily relies on the quality and quantity of their training data. However, a fundamental bottleneck persists: collecting interaction trajectories from real-world websites is expensive and difficult to verify. The underlying state transitions are hidden, leading to reliance on inconsistent and costly external verifiers to evaluate step-level correctness. To address this, we propose AutoWebWorld, a novel framework for synthesizing controllable and verifiable web environments by modeling them as Finite State Machines (FSMs) and use coding agents to translate FSMs into interactive websites. Unlike real websites, where state transitions are implicit, AutoWebWorld explicitly defines all states, actions, and transition rules. This enables programmatic verification: action correctness is checked against predefined rules, and task success is confirmed by reaching a goal state in the FSM graph. AutoWebWorld enables a fully automated search-and-verify pipeline, generating over 11,663 verified trajectories from 29 diverse web environments at only $0.04 per trajectory. Training on this synthetic data significantly boosts real-world performance. Our 7B Web GUI agent outperforms all baselines within 15 steps on WebVoyager. Furthermore, we observe a clear scaling law: as the synthetic data volume increases, performance on WebVoyager and Online-Mind2Web consistently improves.