NeoVerse: Улучшение 4D World Model с помощью моноскопических видео из реального мира
NeoVerse: Enhancing 4D World Model with in-the-wild Monocular Videos
January 1, 2026
Авторы: Yuxue Yang, Lue Fan, Ziqi Shi, Junran Peng, Feng Wang, Zhaoxiang Zhang
cs.AI
Аннотация
В данной статье мы представляем NeoVerse — универсальную 4D-модель мира, способную выполнять 4D-реконструкцию, генерировать видео по новым траекториям и решать широкий спектр прикладных задач. Сначала мы выявляем общее ограничение масштабируемости современных методов моделирования 4D-мира, вызванное либо использованием дорогих специализированных многовидовых 4D-данных, либо громоздкой предобработкой при обучении. В отличие от них, NeoVerse построена на ключевой идее, обеспечивающей масштабируемость всего пайплайна для разнородных моноскопических видео из реального мира. В частности, NeoVerse обладает такими особенностями, как 4D-реконструкция без данных о позе в прямом проходе, онлайн-моделирование паттернов деградации для моноскопических данных и другими согласованными методиками. Данные решения наделяют NeoVerse универсальностью и способностью к обобщению в различных областях. При этом NeoVerse демонстрирует наилучшие результаты на стандартных бенчмарках реконструкции и генерации. Страница проекта доступна по адресу https://neoverse-4d.github.io.
English
In this paper, we propose NeoVerse, a versatile 4D world model that is capable of 4D reconstruction, novel-trajectory video generation, and rich downstream applications. We first identify a common limitation of scalability in current 4D world modeling methods, caused either by expensive and specialized multi-view 4D data or by cumbersome training pre-processing. In contrast, our NeoVerse is built upon a core philosophy that makes the full pipeline scalable to diverse in-the-wild monocular videos. Specifically, NeoVerse features pose-free feed-forward 4D reconstruction, online monocular degradation pattern simulation, and other well-aligned techniques. These designs empower NeoVerse with versatility and generalization to various domains. Meanwhile, NeoVerse achieves state-of-the-art performance in standard reconstruction and generation benchmarks. Our project page is available at https://neoverse-4d.github.io