ChatPaper.aiChatPaper

Function2Scene: Diseño de Escena Interior en 3D a partir de Especificaciones Funcionales

Function2Scene: 3D Indoor Scene Layout from Functional Specifications

May 29, 2026
Autores: Ruiqi Wang, Qimin Chen, Daniel Ritchie, Angel X. Chang, Manolis Savva, Kai Wang, Hao Zhang
cs.AI

Resumen

La mayoría de los métodos de síntesis de escenas interiores 3D basados en texto generan habitaciones a partir de indicaciones centradas en objetos, preguntando qué muebles colocar en lugar de cómo se utiliza el espacio. Sin embargo, en el diseño de interiores real, una distribución se juzga por lo bien que satisface las necesidades de sus ocupantes, por ejemplo, sus actividades y necesidades físicas. Presentamos Function2Scene, un marco para generar distribuciones interiores 3D a partir de especificaciones funcionales, es decir, breves de diseño en lenguaje natural que describen quién usará una habitación y qué necesita hacer allí. Dada dicha especificación, nuestro sistema analiza las personas ocupantes y sus actividades, deriva un conjunto personalizado de restricciones de diseño funcional a partir de una taxonomía de 17 criterios que abarcan consideraciones espaciales, ergonómicas, de actividad y ambientales, y utiliza estas restricciones para guiar la generación de la distribución. En lugar de depender de un LLM para producir directamente una escena final, Function2Scene realiza una evaluación y refinamiento iterativos mediante un bucle de verificación y reparación asistido por herramientas, combinando mediciones geométricas, razonamiento contextual basado en LLM y evaluación visual basada en VLM. Los experimentos con 30 casos de diseño de interiores escritos profesionalmente muestran que Function2Scene produce distribuciones que satisfacen mejor los requisitos funcionales que las líneas base recientes de síntesis de escenas basadas en LLM, con nuestros resultados preferidos en el 94,3% de las comparaciones por pares. Nuestro trabajo replantea la síntesis de escenas interiores basada en texto, pasando de colocar objetos plausibles a diseñar espacios que respalden el uso humano.
English
Most text-driven 3D indoor scene synthesis methods generate rooms from object-centric prompts, asking what furniture should be placed rather than how the space is used. Yet in real interior design, a layout is judged by how well it supports its occupants, e.g., their activities and physical needs. We introduce Function2Scene, a framework for generating 3D indoor layouts from functional specifications, i.e., natural-language design briefs describing who will use a room and what they need to do there. Given such a specification, our system parses occupant personas and activities, derives a customized set of functional design constraints from a taxonomy of 17 criteria spanning spatial, ergonomic, activity, and environmental considerations, and uses these constraints to guide layout generation. Rather than relying on an LLM to directly produce a final scene, Function2Scene performs iterative evaluation and refinement through a tool-augmented check-and-repair loop, combining geometric measurements, LLM-based contextual reasoning, and VLM-based visual assessment. Experiments on 30 professionally written interior-design cases show that Function2Scene produces layouts that better satisfy functional requirements than recent LLM-based scene synthesis baselines, with our results preferred in 94.3% of pairwise comparisons. Our work reframes text-driven indoor scene synthesis from placing plausible objects to designing spaces that support human use.