ChatPaper.aiChatPaper

Skyfall-GS: Síntese de Cenas Urbanas 3D Imersivas a partir de Imagens de Satélite

Skyfall-GS: Synthesizing Immersive 3D Urban Scenes from Satellite Imagery

October 17, 2025
Autores: Jie-Ying Lee, Yi-Ruei Liu, Shr-Ruei Tsai, Wei-Cheng Chang, Chung-Ho Wu, Jiewen Chan, Zhenjun Zhao, Chieh Hubert Lin, Yu-Lun Liu
cs.AI

Resumo

A síntese de cenas urbanas 3D em grande escala, exploráveis e geometricamente precisas é uma tarefa desafiadora, porém valiosa, para fornecer aplicações imersivas e incorporadas. Os desafios residem na escassez de varreduras 3D em grande escala e de alta qualidade do mundo real para treinar modelos generativos generalizáveis. Neste artigo, adotamos uma abordagem alternativa para criar cenas 3D em grande escala, combinando imagens de satélite prontamente disponíveis, que fornecem geometria grosseira realista, e o modelo de difusão de domínio aberto para criar aparências de close-up de alta qualidade. Propomos o Skyfall-GS, o primeiro framework de criação de cenas 3D em escala de quarteirão sem anotações 3D custosas, que também oferece exploração 3D imersiva em tempo real. Adaptamos uma estratégia de refinamento iterativo orientada por currículo para aprimorar progressivamente a completude geométrica e as texturas fotorrealistas. Experimentos extensivos demonstram que o Skyfall-GS fornece geometria consistente entre visões aprimorada e texturas mais realistas em comparação com as abordagens state-of-the-art. Página do projeto: https://skyfall-gs.jayinnn.dev/
English
Synthesizing large-scale, explorable, and geometrically accurate 3D urban scenes is a challenging yet valuable task in providing immersive and embodied applications. The challenges lie in the lack of large-scale and high-quality real-world 3D scans for training generalizable generative models. In this paper, we take an alternative route to create large-scale 3D scenes by synergizing the readily available satellite imagery that supplies realistic coarse geometry and the open-domain diffusion model for creating high-quality close-up appearances. We propose Skyfall-GS, the first city-block scale 3D scene creation framework without costly 3D annotations, also featuring real-time, immersive 3D exploration. We tailor a curriculum-driven iterative refinement strategy to progressively enhance geometric completeness and photorealistic textures. Extensive experiments demonstrate that Skyfall-GS provides improved cross-view consistent geometry and more realistic textures compared to state-of-the-art approaches. Project page: https://skyfall-gs.jayinnn.dev/
PDF393October 20, 2025