ChatPaper.aiChatPaper

Function2Scene : Génération d'agencements de scènes intérieures 3D à partir de spécifications fonctionnelles

Function2Scene: 3D Indoor Scene Layout from Functional Specifications

May 29, 2026
Auteurs: Ruiqi Wang, Qimin Chen, Daniel Ritchie, Angel X. Chang, Manolis Savva, Kai Wang, Hao Zhang
cs.AI

Résumé

La plupart des méthodes de synthèse de scènes intérieures 3D guidées par du texte génèrent des pièces à partir de consignes centrées sur les objets, demandant quels meubles placer plutôt que comment l'espace est utilisé. Pourtant, dans la conception d'intérieur réelle, un agencement est jugé sur sa capacité à répondre aux besoins de ses occupants, par exemple leurs activités et leurs besoins physiques. Nous présentons Function2Scene, un cadre pour générer des agencements d'intérieur 3D à partir de spécifications fonctionnelles, c'est-à-dire des cahiers des charges en langage naturel décrivant qui utilisera une pièce et ce qu'ils doivent y faire. À partir d'une telle spécification, notre système analyse les profils d'occupants et les activités, dérive un ensemble personnalisé de contraintes de conception fonctionnelle à partir d'une taxonomie de 17 critères couvrant les aspects spatiaux, ergonomiques, liés aux activités et environnementaux, et utilise ces contraintes pour guider la génération de l'agencement. Plutôt que de s'appuyer sur un LLM pour produire directement une scène finale, Function2Scene effectue une évaluation et un raffinement itératifs via une boucle de vérification et de correction augmentée d'outils, combinant des mesures géométriques, un raisonnement contextuel basé sur un LLM et une évaluation visuelle basée sur un VLM. Les expériences menées sur 30 cas de conception d'intérieur rédigés par des professionnels montrent que Function2Scene produit des agencements qui satisfont mieux les exigences fonctionnelles que les récentes méthodes de base de synthèse de scènes basées sur LLM, nos résultats étant préférés dans 94,3 % des comparaisons par paires. Notre travail reformule la synthèse de scènes intérieures guidée par du texte, passant du placement d'objets plausibles à la conception d'espaces qui soutiennent l'usage humain.
English
Most text-driven 3D indoor scene synthesis methods generate rooms from object-centric prompts, asking what furniture should be placed rather than how the space is used. Yet in real interior design, a layout is judged by how well it supports its occupants, e.g., their activities and physical needs. We introduce Function2Scene, a framework for generating 3D indoor layouts from functional specifications, i.e., natural-language design briefs describing who will use a room and what they need to do there. Given such a specification, our system parses occupant personas and activities, derives a customized set of functional design constraints from a taxonomy of 17 criteria spanning spatial, ergonomic, activity, and environmental considerations, and uses these constraints to guide layout generation. Rather than relying on an LLM to directly produce a final scene, Function2Scene performs iterative evaluation and refinement through a tool-augmented check-and-repair loop, combining geometric measurements, LLM-based contextual reasoning, and VLM-based visual assessment. Experiments on 30 professionally written interior-design cases show that Function2Scene produces layouts that better satisfy functional requirements than recent LLM-based scene synthesis baselines, with our results preferred in 94.3% of pairwise comparisons. Our work reframes text-driven indoor scene synthesis from placing plausible objects to designing spaces that support human use.