ChatPaper.aiChatPaper

Function2Scene: 3D-Innenraumszenen-Layout aus funktionalen Spezifikationen

Function2Scene: 3D Indoor Scene Layout from Functional Specifications

May 29, 2026
Autoren: Ruiqi Wang, Qimin Chen, Daniel Ritchie, Angel X. Chang, Manolis Savva, Kai Wang, Hao Zhang
cs.AI

Zusammenfassung

Die meisten textgesteuerten Verfahren zur Synthese von 3D-Innenraumszenen erzeugen Räume aus objektzentrierten Vorgaben, die danach fragen, welche Möbel platziert werden sollen, statt wie der Raum genutzt wird. In der realen Innenarchitektur wird ein Grundriss jedoch danach beurteilt, wie gut er die Nutzer unterstützt, z. B. deren Aktivitäten und physische Bedürfnisse. Wir stellen Function2Scene vor, ein Framework zur Erzeugung von 3D-Innenraumgrundrissen aus funktionalen Spezifikationen, d. h. Designbriefen in natürlicher Sprache, die beschreiben, wer einen Raum nutzen wird und was dort getan werden muss. Unser System analysiert aus einer solchen Spezifikation Nutzergruppen und Aktivitäten, leitet einen maßgeschneiderten Satz funktionaler Designbeschränkungen aus einer Taxonomie von 17 Kriterien ab, die räumliche, ergonomische, aktivitätsbezogene und umweltrelevante Aspekte umfassen, und nutzt diese Beschränkungen zur Steuerung der Grundrisserzeugung. Anstatt sich auf ein LLM zu verlassen, das direkt eine finale Szene produziert, führt Function2Scene eine iterative Bewertung und Verfeinerung durch eine werkzeuggestützte Überprüfungs- und Reparaturschleife durch, die geometrische Messungen, LLM-basierte kontextuelle Argumentation und VLM-basierte visuelle Bewertung kombiniert. Experimente an 30 professionell verfassten Innenarchitekturfällen zeigen, dass Function2Scene Grundrisse erzeugt, die funktionale Anforderungen besser erfüllen als neuere LLM-basierte Szenensynthese-Baselines, wobei unsere Ergebnisse in 94,3 % der paarweisen Vergleiche bevorzugt werden. Unsere Arbeit stellt die textgesteuerte Innenraumszenensynthese vom Platzieren plausibler Objekte auf das Gestalten von Räumen um, die die menschliche Nutzung unterstützen.
English
Most text-driven 3D indoor scene synthesis methods generate rooms from object-centric prompts, asking what furniture should be placed rather than how the space is used. Yet in real interior design, a layout is judged by how well it supports its occupants, e.g., their activities and physical needs. We introduce Function2Scene, a framework for generating 3D indoor layouts from functional specifications, i.e., natural-language design briefs describing who will use a room and what they need to do there. Given such a specification, our system parses occupant personas and activities, derives a customized set of functional design constraints from a taxonomy of 17 criteria spanning spatial, ergonomic, activity, and environmental considerations, and uses these constraints to guide layout generation. Rather than relying on an LLM to directly produce a final scene, Function2Scene performs iterative evaluation and refinement through a tool-augmented check-and-repair loop, combining geometric measurements, LLM-based contextual reasoning, and VLM-based visual assessment. Experiments on 30 professionally written interior-design cases show that Function2Scene produces layouts that better satisfy functional requirements than recent LLM-based scene synthesis baselines, with our results preferred in 94.3% of pairwise comparisons. Our work reframes text-driven indoor scene synthesis from placing plausible objects to designing spaces that support human use.