ChatPaper.aiChatPaper

Muses: Het Ontwerpen, Componeren en Genereren van Niet-Bestaande Fantasie 3D-Wezens zonder Training

Muses: Designing, Composing, Generating Nonexistent Fantasy 3D Creatures without Training

January 6, 2026
Auteurs: Hexiao Lu, Xiaokun Sun, Zeyu Cai, Hao Guo, Ying Tai, Jian Yang, Zhenyu Zhang
cs.AI

Samenvatting

Wij presenteren Muses, de eerste trainingsvrije methode voor fantastische 3D-wezengeneratie in een feed-forward paradigma. Bestaande methoden, die vertrouwen op deelbewuste optimalisatie, manuele assemblage of 2D-beeldgeneratie, produceren vaak onrealistische of onsamenhangende 3D-assets vanwege de uitdagingen van intricate deelniveau-manipulatie en beperkte out-of-domain-generatie. Muses daarentegen benut het 3D-skelet, een fundamentele representatie van biologische vormen, om diverse elementen expliciet en rationeel samen te stellen. Deze skeletbasis formaliseert 3D-contentcreatie als een structuurbewuste pijplijn van ontwerp, compositie en generatie. Muses begint met het construeren van een creatief samengesteld 3D-skelet met een samenhangende lay-out en schaal door middel van grafisch-gebonden redenering. Dit skelet leidt vervolgens een op voxels gebaseerd assemblageproces binnen een gestructureerde latente ruimte, waarbij regio's van verschillende objecten worden geïntegreerd. Ten slotte wordt beeldgestuurd uiterlijk-modelering onder skeletcondities toegepast om een stijlconsistente en harmonieuze textuur voor de samengestelde vorm te genereren. Uitgebreide experimenten bevestigen de state-of-the-art prestaties van Muses wat betreft visuele kwaliteit en afstemming met tekstuele beschrijvingen, evenals het potentieel voor flexibele 3D-objectbewerking. Projectpagina: https://luhexiao.github.io/Muses.github.io/.
English
We present Muses, the first training-free method for fantastic 3D creature generation in a feed-forward paradigm. Previous methods, which rely on part-aware optimization, manual assembly, or 2D image generation, often produce unrealistic or incoherent 3D assets due to the challenges of intricate part-level manipulation and limited out-of-domain generation. In contrast, Muses leverages the 3D skeleton, a fundamental representation of biological forms, to explicitly and rationally compose diverse elements. This skeletal foundation formalizes 3D content creation as a structure-aware pipeline of design, composition, and generation. Muses begins by constructing a creatively composed 3D skeleton with coherent layout and scale through graph-constrained reasoning. This skeleton then guides a voxel-based assembly process within a structured latent space, integrating regions from different objects. Finally, image-guided appearance modeling under skeletal conditions is applied to generate a style-consistent and harmonious texture for the assembled shape. Extensive experiments establish Muses' state-of-the-art performance in terms of visual fidelity and alignment with textual descriptions, and potential on flexible 3D object editing. Project page: https://luhexiao.github.io/Muses.github.io/.
PDF32January 8, 2026