Muses: Entwurf, Komposition und Erzeugung nichtexistierter fantastischer 3D-Kreaturen ohne Training
Muses: Designing, Composing, Generating Nonexistent Fantasy 3D Creatures without Training
January 6, 2026
papers.authors: Hexiao Lu, Xiaokun Sun, Zeyu Cai, Hao Guo, Ying Tai, Jian Yang, Zhenyu Zhang
cs.AI
papers.abstract
Wir stellen Muses vor, die erste trainingsfreie Methode zur fantastischen 3D-Kreaturengenerierung in einem Vorwärtsverarbeitungsparadigma. Bisherige Methoden, die auf teilbewusster Optimierung, manueller Zusammenstellung oder 2D-Bildgenerierung basieren, erzeugen oft unrealistische oder inkohärente 3D-Assets aufgrund der Herausforderungen intricater teilbezogener Manipulation und begrenzter Out-of-Domain-Generierung. Im Gegensatz dazu nutzt Muses das 3D-Skelett, eine fundamentale Repräsentation biologischer Formen, um diverse Elemente explizit und rational zusammenzusetzen. Diese skeletale Grundlage formalisiert die 3D-Inhaltserstellung als eine strukturbewusste Pipeline aus Design, Komposition und Generierung. Muses beginnt mit der Konstruktion eines kreativ zusammengesetzten 3D-Skeletts mit kohärenter Anordnung und Skalierung durch graph-beschränktes Reasoning. Dieses Skelett leitet dann einen voxelbasierten Assemblierungsprozess in einem strukturierten latenten Raum an, der Regionen verschiedener Objekte integriert. Abschließend wird eine bildgeführte Erscheinungsmodellierung unter Skelettbedingungen angewendet, um eine stilistisch konsistente und harmonische Textur für die zusammengesetzte Form zu generieren. Umfangreiche Experimente belegen Muses' state-of-the-art Leistung in Bezug auf visuelle Qualität und Übereinstimmung mit Textbeschreibungen sowie das Potenzial für flexible 3D-Objekteditierung. Projektseite: https://luhexiao.github.io/Muses.github.io/.
English
We present Muses, the first training-free method for fantastic 3D creature generation in a feed-forward paradigm. Previous methods, which rely on part-aware optimization, manual assembly, or 2D image generation, often produce unrealistic or incoherent 3D assets due to the challenges of intricate part-level manipulation and limited out-of-domain generation. In contrast, Muses leverages the 3D skeleton, a fundamental representation of biological forms, to explicitly and rationally compose diverse elements. This skeletal foundation formalizes 3D content creation as a structure-aware pipeline of design, composition, and generation. Muses begins by constructing a creatively composed 3D skeleton with coherent layout and scale through graph-constrained reasoning. This skeleton then guides a voxel-based assembly process within a structured latent space, integrating regions from different objects. Finally, image-guided appearance modeling under skeletal conditions is applied to generate a style-consistent and harmonious texture for the assembled shape. Extensive experiments establish Muses' state-of-the-art performance in terms of visual fidelity and alignment with textual descriptions, and potential on flexible 3D object editing. Project page: https://luhexiao.github.io/Muses.github.io/.