Muses : Concevoir, composer et générer des créatures fantastiques 3D inexistantes sans apprentissage
Muses: Designing, Composing, Generating Nonexistent Fantasy 3D Creatures without Training
January 6, 2026
papers.authors: Hexiao Lu, Xiaokun Sun, Zeyu Cai, Hao Guo, Ying Tai, Jian Yang, Zhenyu Zhang
cs.AI
papers.abstract
Nous présentons Muses, la première méthode sans entraînement pour la génération de créatures 3D fantastiques dans un paradigme de traitement direct. Les méthodes antérieures, qui reposent sur une optimisation consciente des parties, un assemblage manuel ou la génération d'images 2D, produisent souvent des assets 3D irréalistes ou incohérents en raison des défis liés à la manipulation détaillée au niveau des parties et à la génération limitée hors domaine. En revanche, Muses exploite le squelette 3D, une représentation fondamentale des formes biologiques, pour composer explicitement et rationnellement des éléments divers. Cette fondation squelettique formalise la création de contenu 3D comme un pipeline de conception, de composition et de génération conscient de la structure. Muses commence par construire un squelette 3D créativement composé avec une cohérence de disposition et d'échelle grâce à un raisonnement sous contraintes de graphes. Ce squelette guide ensuite un processus d'assemblage basé sur les voxels dans un espace latent structuré, intégrant des régions provenant de différents objets. Enfin, une modélisation d'apparence guidée par image sous conditions squelettiques est appliquée pour générer une texture harmonieuse et cohérente de style pour la forme assemblée. Des expériences approfondies établissent les performances de pointe de Muses en termes de fidélité visuelle et d'alignement avec les descriptions textuelles, ainsi que son potentiel pour l'édition flexible d'objets 3D. Page du projet : https://luhexiao.github.io/Muses.github.io/.
English
We present Muses, the first training-free method for fantastic 3D creature generation in a feed-forward paradigm. Previous methods, which rely on part-aware optimization, manual assembly, or 2D image generation, often produce unrealistic or incoherent 3D assets due to the challenges of intricate part-level manipulation and limited out-of-domain generation. In contrast, Muses leverages the 3D skeleton, a fundamental representation of biological forms, to explicitly and rationally compose diverse elements. This skeletal foundation formalizes 3D content creation as a structure-aware pipeline of design, composition, and generation. Muses begins by constructing a creatively composed 3D skeleton with coherent layout and scale through graph-constrained reasoning. This skeleton then guides a voxel-based assembly process within a structured latent space, integrating regions from different objects. Finally, image-guided appearance modeling under skeletal conditions is applied to generate a style-consistent and harmonious texture for the assembled shape. Extensive experiments establish Muses' state-of-the-art performance in terms of visual fidelity and alignment with textual descriptions, and potential on flexible 3D object editing. Project page: https://luhexiao.github.io/Muses.github.io/.