ChatPaper.aiChatPaper

ScenePainter : Génération perpétuelle de scènes 3D sémantiquement cohérentes avec alignement des relations conceptuelles

ScenePainter: Semantically Consistent Perpetual 3D Scene Generation with Concept Relation Alignment

July 25, 2025
papers.authors: Chong Xia, Shengjun Zhang, Fangfu Liu, Chang Liu, Khodchaphun Hirunyaratsameewong, Yueqi Duan
cs.AI

papers.abstract

La génération perpétuelle de scènes 3D vise à produire des séquences de vues 3D cohérentes et à longue portée, applicables à la synthèse vidéo à long terme et à la reconstruction de scènes 3D. Les méthodes existantes suivent une approche de "navigation et imagination" et s'appuient sur l'extrapolation pour l'expansion successive des vues. Cependant, les séquences de vues générées souffrent d'un problème de dérive sémantique dû à l'accumulation des écarts du module d'extrapolation. Pour relever ce défi, nous proposons ScenePainter, un nouveau cadre pour la génération de scènes 3D sémantiquement cohérentes, qui aligne l'a priori spécifique à la scène de l'extrapolateur avec la compréhension de la scène actuelle. Plus précisément, nous introduisons une structure graphique hiérarchique appelée SceneConceptGraph pour construire des relations entre les concepts de scène à plusieurs niveaux, qui guide l'extrapolateur pour des vues nouvelles et cohérentes et peut être dynamiquement affinée pour améliorer la diversité. Des expériences approfondies démontrent que notre cadre surmonte le problème de dérive sémantique et génère des séquences de vues 3D plus cohérentes et immersives. Page du projet : https://xiac20.github.io/ScenePainter/.
English
Perpetual 3D scene generation aims to produce long-range and coherent 3D view sequences, which is applicable for long-term video synthesis and 3D scene reconstruction. Existing methods follow a "navigate-and-imagine" fashion and rely on outpainting for successive view expansion. However, the generated view sequences suffer from semantic drift issue derived from the accumulated deviation of the outpainting module. To tackle this challenge, we propose ScenePainter, a new framework for semantically consistent 3D scene generation, which aligns the outpainter's scene-specific prior with the comprehension of the current scene. To be specific, we introduce a hierarchical graph structure dubbed SceneConceptGraph to construct relations among multi-level scene concepts, which directs the outpainter for consistent novel views and can be dynamically refined to enhance diversity. Extensive experiments demonstrate that our framework overcomes the semantic drift issue and generates more consistent and immersive 3D view sequences. Project Page: https://xiac20.github.io/ScenePainter/.
PDF82July 29, 2025