ЭнерВселенная: Визуализация Воплощенного Будущего Пространства для Робототехнического УправленияEnerVerse: Envisioning Embodied Future Space for Robotics Manipulation
Мы представляем EnerVerse - комплексную платформу для создания воплощенного будущего пространства, специально разработанную для задач робототехники. EnerVerse плавно интегрирует механизмы свертки и двунаправленного внимания для моделирования пространства внутри блока, обеспечивая согласованность и непрерывность на низком уровне. Учитывая врожденную избыточность видеоданных, мы предлагаем разреженный контекст памяти в сочетании с частично однонаправленной генеративной парадигмой для возможности генерации бесконечных последовательностей. Для дополнительного расширения возможностей роботов мы представляем пространство Свободного Анкера Обзора (FAV), которое предоставляет гибкие перспективы для улучшения наблюдения и анализа. Пространство FAV уменьшает неоднозначность моделирования движения, устраняет физические ограничения в ограниченных средах и значительно повышает обобщение и адаптивность робота в различных задачах и средах. Для решения проблематичных затрат и трудоемкости при получении многокамерных наблюдений мы представляем конвейер данных, который интегрирует генеративную модель с 4D Гауссовским Сплетением (4DGS). Этот конвейер использует надежные возможности обобщения генеративной модели и пространственные ограничения, предоставленные 4DGS, обеспечивая итеративное улучшение качества и разнообразия данных, что создает эффект "летучего колеса" данных, эффективно сужая разрыв между симуляцией и реальностью. Наконец, наши эксперименты показывают, что предшествующее создание воплощенного будущего пространства значительно улучшает возможности прогнозирования политики, приводя к улучшению общей производительности, особенно в задачах робототехники на дальние расстояния.