PhysForge: Het Genereren van Fysisch Onderbouwde 3D-Assets voor Interactieve Virtuele Werelden
PhysForge: Generating Physics-Grounded 3D Assets for Interactive Virtual World
May 6, 2026
Auteurs: Yunhan Yang, Chunshi Wang, Junliang Ye, Yang Li, Zanxin Chen, Zehuan Huang, Yao Mu, Zhuo Chen, Chunchao Guo, Xihui Liu
cs.AI
Samenvatting
Het synthetiseren van fysisch onderbouwde 3D-assets vormt een kritieke bottleneck voor interactieve virtuele werelden en 'embodied AI'. Bestaande methodes richten zich voornamelijk op statische geometrie en negeren de functionele eigenschappen die essentieel zijn voor interactie. Wij stellen dat de generatie van interactieve assets geworteld moet zijn in functionele logica en hiërarchische fysica. Om deze kloof te overbruggen, introduceren wij PhysForge, een ontkoppeld tweestapsraamwerk ondersteund door PhysDB, een grootschalige dataset van 150.000 assets met viervoudige fysieke annotaties. Eerst fungeert een VLM als een 'fysisch architect' om een 'Hiërarchisch Fysisch Blauwdruk' te plannen, die materiaal-, functionele en kinematische beperkingen definieert. Vervolgens realiseert een fysisch onderbouwd diffusiemodel deze blauwdruk door hoogwaardige geometrie te synthetiseren samen met precieze kinematische parameters via een nieuw KineVoxel Injection (KVI)-mechanisme. Experimenten tonen aan dat PhysForge functioneel plausibele, simulatieklare assets produceert, en zo een robuuste data-engine biedt voor interactieve 3D-inhoud en 'embodied agents'.
English
Synthesizing physics-grounded 3D assets is a critical bottleneck for interactive virtual worlds and embodied AI. Existing methods predominantly focus on static geometry, overlooking the functional properties essential for interaction. We propose that interactive asset generation must be rooted in functional logic and hierarchical physics. To bridge this gap, we introduce PhysForge, a decoupled two-stage framework supported by PhysDB, a large-scale dataset of 150,000 assets with four-tier physical annotations. First, a VLM acts as a "physical architect" to plan a "Hierarchical Physical Blueprint" defining material, functional, and kinematic constraints. Second, a physics-grounded diffusion model realizes this blueprint by synthesizing high-fidelity geometry alongside precise kinematic parameters via a novel KineVoxel Injection (KVI) mechanism. Experiments demonstrate that PhysForge produces functionally plausible, simulation-ready assets, providing a robust data engine for interactive 3D content and embodied agents.