CHOrD: Generazione di Gemelli Digitali Organizzati, Scala Abitativa e Privi di Collisioni per Scene Indoor 3D con Piante Controllabili e Layout Ottimali
CHOrD: Generation of Collision-Free, House-Scale, and Organized Digital Twins for 3D Indoor Scenes with Controllable Floor Plans and Optimal Layouts
March 15, 2025
Autori: Chong Su, Yingbin Fu, Zheyuan Hu, Jing Yang, Param Hanji, Shaojun Wang, Xuan Zhao, Cengiz Öztireli, Fangcheng Zhong
cs.AI
Abstract
Presentiamo CHOrD, un nuovo framework per la sintesi scalabile di scene 3D interne, progettato per creare gemelli digitali di interni su scala domestica, privi di collisioni e strutturati gerarchicamente. A differenza dei metodi esistenti che sintetizzano direttamente il layout della scena come grafo della scena o lista di oggetti, CHOrD incorpora una rappresentazione intermedia del layout basata su immagini 2D, consentendo di prevenire efficacemente gli artefatti di collisione catturandoli con successo come scenari out-of-distribution (OOD) durante la generazione. Inoltre, a differenza dei metodi esistenti, CHOrD è in grado di generare layout di scene che aderiscono a piante complesse con controlli multimodali, permettendo la creazione di layout coerenti su scala domestica, robusti sia alle variazioni geometriche che semantiche delle strutture delle stanze. In aggiunta, proponiamo un nuovo dataset con una copertura ampliata di oggetti domestici e configurazioni di stanze, nonché una qualità dei dati significativamente migliorata. CHOrD dimostra prestazioni all'avanguardia sia su 3D-FRONT che sul nostro dataset proposto, offrendo una sintesi di scene interne fotorealistiche e spazialmente coerenti, adattabile a variazioni arbitrarie delle piante.
English
We introduce CHOrD, a novel framework for scalable synthesis of 3D indoor
scenes, designed to create house-scale, collision-free, and hierarchically
structured indoor digital twins. In contrast to existing methods that directly
synthesize the scene layout as a scene graph or object list, CHOrD incorporates
a 2D image-based intermediate layout representation, enabling effective
prevention of collision artifacts by successfully capturing them as
out-of-distribution (OOD) scenarios during generation. Furthermore, unlike
existing methods, CHOrD is capable of generating scene layouts that adhere to
complex floor plans with multi-modal controls, enabling the creation of
coherent, house-wide layouts robust to both geometric and semantic variations
in room structures. Additionally, we propose a novel dataset with expanded
coverage of household items and room configurations, as well as significantly
improved data quality. CHOrD demonstrates state-of-the-art performance on both
the 3D-FRONT and our proposed datasets, delivering photorealistic, spatially
coherent indoor scene synthesis adaptable to arbitrary floor plan variations.