CHOrD : Génération de jumeaux numériques sans collision, à l'échelle domestique et organisés pour des scènes intérieures 3D avec plans d'étage contrôlables et agencements optimaux
CHOrD: Generation of Collision-Free, House-Scale, and Organized Digital Twins for 3D Indoor Scenes with Controllable Floor Plans and Optimal Layouts
March 15, 2025
Auteurs: Chong Su, Yingbin Fu, Zheyuan Hu, Jing Yang, Param Hanji, Shaojun Wang, Xuan Zhao, Cengiz Öztireli, Fangcheng Zhong
cs.AI
Résumé
Nous présentons CHOrD, un nouveau cadre pour la synthèse évolutive de scènes intérieures en 3D, conçu pour créer des jumeaux numériques intérieurs à l'échelle d'une maison, exempts de collisions et structurés hiérarchiquement. Contrairement aux méthodes existantes qui synthétisent directement la disposition de la scène sous forme de graphe de scène ou de liste d'objets, CHOrD intègre une représentation intermédiaire de la disposition basée sur des images 2D, permettant de prévenir efficacement les artefacts de collision en les capturant avec succès comme des scénarios hors distribution (OOD) lors de la génération. De plus, contrairement aux méthodes existantes, CHOrD est capable de générer des dispositions de scènes qui respectent des plans d'étage complexes avec des contrôles multi-modaux, permettant la création de dispositions cohérentes à l'échelle de la maison, robustes aux variations géométriques et sémantiques des structures de pièces. Par ailleurs, nous proposons un nouveau jeu de données avec une couverture élargie des articles ménagers et des configurations de pièces, ainsi qu'une qualité de données significativement améliorée. CHOrD démontre des performances de pointe à la fois sur le jeu de données 3D-FRONT et sur notre jeu de données proposé, offrant une synthèse de scènes intérieures photoréalistes et spatialement cohérentes, adaptable à des variations arbitraires de plans d'étage.
English
We introduce CHOrD, a novel framework for scalable synthesis of 3D indoor
scenes, designed to create house-scale, collision-free, and hierarchically
structured indoor digital twins. In contrast to existing methods that directly
synthesize the scene layout as a scene graph or object list, CHOrD incorporates
a 2D image-based intermediate layout representation, enabling effective
prevention of collision artifacts by successfully capturing them as
out-of-distribution (OOD) scenarios during generation. Furthermore, unlike
existing methods, CHOrD is capable of generating scene layouts that adhere to
complex floor plans with multi-modal controls, enabling the creation of
coherent, house-wide layouts robust to both geometric and semantic variations
in room structures. Additionally, we propose a novel dataset with expanded
coverage of household items and room configurations, as well as significantly
improved data quality. CHOrD demonstrates state-of-the-art performance on both
the 3D-FRONT and our proposed datasets, delivering photorealistic, spatially
coherent indoor scene synthesis adaptable to arbitrary floor plan variations.