Function2Scene: 機能仕様からの3D屋内シーンレイアウト
Function2Scene: 3D Indoor Scene Layout from Functional Specifications
May 29, 2026
著者: Ruiqi Wang, Qimin Chen, Daniel Ritchie, Angel X. Chang, Manolis Savva, Kai Wang, Hao Zhang
cs.AI
要旨
既存のテキスト駆動型3D室内シーン合成手法の大半は、オブジェクト中心のプロンプトに基づいて部屋を生成し、「どの家具を配置すべきか」は問うものの、「空間がどのように使用されるか」は考慮していない。しかし実際のインテリアデザインでは、レイアウトはその空間の利用者(例えば、彼らの活動や身体的ニーズ)をいかにうまく支援するかによって評価される。我々は、機能仕様(すなわち、部屋を誰が使用し、そこで何を行う必要があるかを記述した自然言語によるデザインブリーフ)から3D室内レイアウトを生成するフレームワーク、Function2Sceneを導入する。本システムは、与えられた仕様に基づいて利用者のペルソナと活動を解析し、空間的、人間工学的、活動的、環境的考慮事項を網羅する17の基準からなる分類体系に従ってカスタマイズされた機能的デザイン制約のセットを導出し、これらの制約を用いてレイアウト生成を誘導する。Function2Sceneは、最終的なシーンをLLMに直接生成させるのではなく、ツール拡張されたチェック・アンド・リペアループ(幾何学的計測、LLMに基づく文脈推論、VLMに基づく視覚評価を組み合わせたもの)による反復的な評価と改良を実行する。プロが作成した30のインテリアデザイン事例を用いた実験により、Function2Sceneは、近年のLLMベースのシーン合成ベースラインと比較して、機能要件をよりよく満たすレイアウトを生成し、ペアワイズ比較の94.3%で我々の結果が好まれることが示された。本研究は、テキスト駆動型室内シーン合成を、妥当なオブジェクトを配置することから、人間の使用を支援する空間を設計することへと方向転換するものである。
English
Most text-driven 3D indoor scene synthesis methods generate rooms from object-centric prompts, asking what furniture should be placed rather than how the space is used. Yet in real interior design, a layout is judged by how well it supports its occupants, e.g., their activities and physical needs. We introduce Function2Scene, a framework for generating 3D indoor layouts from functional specifications, i.e., natural-language design briefs describing who will use a room and what they need to do there. Given such a specification, our system parses occupant personas and activities, derives a customized set of functional design constraints from a taxonomy of 17 criteria spanning spatial, ergonomic, activity, and environmental considerations, and uses these constraints to guide layout generation. Rather than relying on an LLM to directly produce a final scene, Function2Scene performs iterative evaluation and refinement through a tool-augmented check-and-repair loop, combining geometric measurements, LLM-based contextual reasoning, and VLM-based visual assessment. Experiments on 30 professionally written interior-design cases show that Function2Scene produces layouts that better satisfy functional requirements than recent LLM-based scene synthesis baselines, with our results preferred in 94.3% of pairwise comparisons. Our work reframes text-driven indoor scene synthesis from placing plausible objects to designing spaces that support human use.