AutoWebWorld: Synthese unendlicher verifizierbarer Web-Umgebungen mittels endlicher Automaten
AutoWebWorld: Synthesizing Infinite Verifiable Web Environments via Finite State Machines
February 15, 2026
Autoren: Yifan Wu, Yiran Peng, Yiyu Chen, Jianhao Ruan, Zijie Zhuang, Cheng Yang, Jiayi Zhang, Man Chen, Yenchi Tseng, Zhaoyang Yu, Liang Chen, Yuyao Zhai, Bang Liu, Chenglin Wu, Yuyu Luo
cs.AI
Zusammenfassung
Die Leistung autonomer Web-GUI-Agenten hängt maßgeblich von der Qualität und Menge ihrer Trainingsdaten ab. Ein grundlegendes Problem bleibt jedoch bestehen: Die Erfassung von Interaktionsverläufen auf realen Websites ist kostspielig und nur schwer zu verifizieren. Die zugrundeliegenden Zustandsübergänge sind verborgen, was zu einer Abhängigkeit von inkonsistenten und teuren externen Verifikationsmechanismen zur Bewertung der Korrektheit auf Einzelschritt-Ebene führt. Um dieses Problem zu lösen, schlagen wir AutoWebWorld vor, einen neuartigen Rahmen zur Synthese steuerbarer und verifizierbarer Webumgebungen, indem diese als Endliche Automaten (Finite State Machines, FSMs) modelliert und Code-generierende Agenten eingesetzt werden, um die FSMs in interaktive Websites zu übersetzen. Im Gegensatz zu realen Websites, bei denen Zustandsübergänge implizit sind, definiert AutoWebWorld alle Zustände, Aktionen und Übergangsregeln explizit. Dies ermöglicht eine programmatische Verifikation: Die Korrektheit einer Aktion wird anhand vordefinierter Regeln geprüft, und der Aufgabenerfolg wird durch das Erreichen eines Zielzustands im FSM-Graphen bestätigt. AutoWebWorld ermöglicht eine vollständig automatisierte Such- und Verifizierungspipeline, die über 11.663 verifizierte Verläufe aus 29 verschiedenen Webumgebungen zu lediglich 0,04 US-Dollar pro Verlauf generiert. Das Training mit diesen synthetischen Daten steigert die Leistung in realen Szenarien erheblich. Unser 7B Web-GUI-Agent übertrifft alle Vergleichsmodelle innerhalb von 15 Schritten auf WebVoyager. Darüber hinaus beobachten wir ein klares Skalengesetz: Mit zunehmendem Umfang der synthetischen Daten verbessert sich die Leistung auf WebVoyager und Online-Mind2Web kontinuierlich.
English
The performance of autonomous Web GUI agents heavily relies on the quality and quantity of their training data. However, a fundamental bottleneck persists: collecting interaction trajectories from real-world websites is expensive and difficult to verify. The underlying state transitions are hidden, leading to reliance on inconsistent and costly external verifiers to evaluate step-level correctness. To address this, we propose AutoWebWorld, a novel framework for synthesizing controllable and verifiable web environments by modeling them as Finite State Machines (FSMs) and use coding agents to translate FSMs into interactive websites. Unlike real websites, where state transitions are implicit, AutoWebWorld explicitly defines all states, actions, and transition rules. This enables programmatic verification: action correctness is checked against predefined rules, and task success is confirmed by reaching a goal state in the FSM graph. AutoWebWorld enables a fully automated search-and-verify pipeline, generating over 11,663 verified trajectories from 29 diverse web environments at only $0.04 per trajectory. Training on this synthetic data significantly boosts real-world performance. Our 7B Web GUI agent outperforms all baselines within 15 steps on WebVoyager. Furthermore, we observe a clear scaling law: as the synthetic data volume increases, performance on WebVoyager and Online-Mind2Web consistently improves.