Promuovere i Modelli Mondiali Open Source
Advancing Open-source World Models
January 28, 2026
Autori: Robbyant Team, Zelin Gao, Qiuyu Wang, Yanhong Zeng, Jiapeng Zhu, Ka Leong Cheng, Yixuan Li, Hanlin Wang, Yinghao Xu, Shuailei Ma, Yihang Chen, Jie Liu, Yansong Cheng, Yao Yao, Jiayi Zhu, Yihao Meng, Kecheng Zheng, Qingyan Bai, Jingye Chen, Zehong Shen, Yue Yu, Xing Zhu, Yujun Shen, Hao Ouyang
cs.AI
Abstract
Presentiamo LingBot-World, un simulatore di mondi open-source derivato dalla generazione video. Posizionato come modello di mondo di alto livello, LingBot-World offre le seguenti caratteristiche. (1) Mantiene un'elevata fedeltà e dinamiche robuste in un'ampia gamma di ambienti, inclusi contesti realistici, scientifici, stili cartoon e oltre. (2) Consente un orizzonte temporale a livello di minuti preservando la coerenza contestuale nel tempo, nota anche come "memoria a lungo termine". (3) Supporta l'interattività in tempo reale, raggiungendo una latenza inferiore a 1 secondo nella produzione di 16 frame al secondo. Metteremo pubblicamente a disposizione il codice e il modello nel tentativo di colmare il divario tra tecnologie open-source e closed-source. Riteniamo che la nostra release potenzierà la comunità con applicazioni pratiche in aree come la creazione di contenuti, i videogiochi e l'apprendimento robotico.
English
We present LingBot-World, an open-sourced world simulator stemming from video generation. Positioned as a top-tier world model, LingBot-World offers the following features. (1) It maintains high fidelity and robust dynamics in a broad spectrum of environments, including realism, scientific contexts, cartoon styles, and beyond. (2) It enables a minute-level horizon while preserving contextual consistency over time, which is also known as "long-term memory". (3) It supports real-time interactivity, achieving a latency of under 1 second when producing 16 frames per second. We provide public access to the code and model in an effort to narrow the divide between open-source and closed-source technologies. We believe our release will empower the community with practical applications across areas like content creation, gaming, and robot learning.