Fortschritt bei Open-Source-Weltmodellen
Advancing Open-source World Models
January 28, 2026
papers.authors: Robbyant Team, Zelin Gao, Qiuyu Wang, Yanhong Zeng, Jiapeng Zhu, Ka Leong Cheng, Yixuan Li, Hanlin Wang, Yinghao Xu, Shuailei Ma, Yihang Chen, Jie Liu, Yansong Cheng, Yao Yao, Jiayi Zhu, Yihao Meng, Kecheng Zheng, Qingyan Bai, Jingye Chen, Zehong Shen, Yue Yu, Xing Zhu, Yujun Shen, Hao Ouyang
cs.AI
papers.abstract
Wir stellen LingBot-World vor, einen quelloffenen Weltsimulator auf Basis von Videogenerierung. Als hochwertiges Weltmodell positioniert, bietet LingBot-World folgende Merkmale: (1) Es bewahrt hohe Detailtreue und robuste Dynamik in einem breiten Spektrum von Umgebungen, einschließlich realistischer, wissenschaftlicher und zeichentrickhafter Szenarien. (2) Es ermöglicht eine minutenschnelle Vorhersage bei gleichzeitiger Wahrung der kontextuellen Konsistenz über die Zeit, was auch als "Langzeitgedächtnis" bekannt ist. (3) Es unterstützt Echtzeit-Interaktivität mit einer Latenz von unter einer Sekunde bei der Erzeugung von 16 Bildern pro Sekunde. Wir stellen Code und Modell öffentlich zur Verfügung, um die Kluft zwischen quelloffenen und proprietären Technologien zu verringern. Wir sind überzeugt, dass unsere Veröffentlichung der Gemeinschaft praktische Anwendungsmöglichkeiten in Bereichen wie Content-Erstellung, Gaming und Robotik-Lernen eröffnen wird.
English
We present LingBot-World, an open-sourced world simulator stemming from video generation. Positioned as a top-tier world model, LingBot-World offers the following features. (1) It maintains high fidelity and robust dynamics in a broad spectrum of environments, including realism, scientific contexts, cartoon styles, and beyond. (2) It enables a minute-level horizon while preserving contextual consistency over time, which is also known as "long-term memory". (3) It supports real-time interactivity, achieving a latency of under 1 second when producing 16 frames per second. We provide public access to the code and model in an effort to narrow the divide between open-source and closed-source technologies. We believe our release will empower the community with practical applications across areas like content creation, gaming, and robot learning.