ChatPaper.aiChatPaper

PhysForge: インタラクティブ仮想世界のための物理ベース3Dアセット生成

PhysForge: Generating Physics-Grounded 3D Assets for Interactive Virtual World

May 6, 2026
著者: Yunhan Yang, Chunshi Wang, Junliang Ye, Yang Li, Zanxin Chen, Zehuan Huang, Yao Mu, Zhuo Chen, Chunchao Guo, Xihui Liu
cs.AI

要旨

物理に基づく3Dアセットの合成は、インタラクティブな仮想世界と具身化AIにおける重要なボトルネックである。既存手法は静的な形状に主眼を置き、インタラクションに必須の機能特性を見落としがちである。我々は、インタラクティブなアセット生成が機能的な論理と階層的な物理に根ざすべきだと提唱する。この隔たりを埋めるため、4段階の物理アノテーションを施した15万アセットからなる大規模データセットPhysDBを基盤とした、分離型2段階フレームワークPhysForgeを提案する。第一段階では、VLMが「物理設計士」として機能し、材質・機能・運動学的制約を定義する「階層的物理設計図」を計画する。第二段階では、物理に基づいた拡散モデルが、新規のKineVoxel Injection(KVI)メカニズムを通じて高精細な形状と精密な運動学パラメータを同時に合成し、この設計図を具現化する。実験により、PhysForgeが機能的に妥当でシミュレーション即応型のアセットを生成し、インタラクティブ3Dコンテンツと具身化エージェントのための堅牢なデータエンジンを提供することを実証する。
English
Synthesizing physics-grounded 3D assets is a critical bottleneck for interactive virtual worlds and embodied AI. Existing methods predominantly focus on static geometry, overlooking the functional properties essential for interaction. We propose that interactive asset generation must be rooted in functional logic and hierarchical physics. To bridge this gap, we introduce PhysForge, a decoupled two-stage framework supported by PhysDB, a large-scale dataset of 150,000 assets with four-tier physical annotations. First, a VLM acts as a "physical architect" to plan a "Hierarchical Physical Blueprint" defining material, functional, and kinematic constraints. Second, a physics-grounded diffusion model realizes this blueprint by synthesizing high-fidelity geometry alongside precise kinematic parameters via a novel KineVoxel Injection (KVI) mechanism. Experiments demonstrate that PhysForge produces functionally plausible, simulation-ready assets, providing a robust data engine for interactive 3D content and embodied agents.
PDF302May 8, 2026