ChatPaper.aiChatPaper

Cosmos-Transfer1: 적응형 다중 모드 제어를 통한 조건부 세계 생성

Cosmos-Transfer1: Conditional World Generation with Adaptive Multimodal Control

March 18, 2025
저자: NVIDIA, Hassan Abu Alhaija, Jose Alvarez, Maciej Bala, Tiffany Cai, Tianshi Cao, Liz Cha, Joshua Chen, Mike Chen, Francesco Ferroni, Sanja Fidler, Dieter Fox, Yunhao Ge, Jinwei Gu, Ali Hassani, Michael Isaev, Pooya Jannaty, Shiyi Lan, Tobias Lasser, Huan Ling, Ming-Yu Liu, Xian Liu, Yifan Lu, Alice Luo, Qianli Ma, Hanzi Mao, Fabio Ramos, Xuanchi Ren, Tianchang Shen, Shitao Tang, Ting-Chun Wang, Jay Wu, Jiashu Xu, Stella Xu, Kevin Xie, Yuchong Ye, Xiaodong Yang, Xiaohui Zeng, Yu Zeng
cs.AI

초록

우리는 세그멘테이션, 깊이, 에지 등 다양한 모달리티의 다중 공간 제어 입력을 기반으로 세계 시뮬레이션을 생성할 수 있는 조건부 세계 생성 모델인 Cosmos-Transfer를 소개합니다. 이 설계에서 공간 조건부 방식은 적응적이고 사용자 정의가 가능합니다. 이는 서로 다른 공간 위치에서 다양한 조건부 입력에 다른 가중치를 부여할 수 있게 하여, 높은 수준의 제어 가능한 세계 생성을 가능하게 합니다. 이는 Sim2Real을 포함한 다양한 세계 간 전환 사용 사례에서 유용하게 활용됩니다. 우리는 제안된 모델을 분석하고, 로봇공학의 Sim2Real 및 자율주행차 데이터 풍부화를 포함한 Physical AI 응용을 입증하기 위해 광범위한 평가를 수행했습니다. 또한, NVIDIA GB200 NVL72 랙을 사용하여 실시간 세계 생성을 달성하기 위한 추론 확장 전략을 보여줍니다. 해당 분야의 연구 개발을 가속화하기 위해, 우리는 모델과 코드를 https://github.com/nvidia-cosmos/cosmos-transfer1에서 오픈소스로 공개합니다.
English
We introduce Cosmos-Transfer, a conditional world generation model that can generate world simulations based on multiple spatial control inputs of various modalities such as segmentation, depth, and edge. In the design, the spatial conditional scheme is adaptive and customizable. It allows weighting different conditional inputs differently at different spatial locations. This enables highly controllable world generation and finds use in various world-to-world transfer use cases, including Sim2Real. We conduct extensive evaluations to analyze the proposed model and demonstrate its applications for Physical AI, including robotics Sim2Real and autonomous vehicle data enrichment. We further demonstrate an inference scaling strategy to achieve real-time world generation with an NVIDIA GB200 NVL72 rack. To help accelerate research development in the field, we open-source our models and code at https://github.com/nvidia-cosmos/cosmos-transfer1.

Summary

AI-Generated Summary

PDF182March 19, 2025