AssetFormer : Génération modulaire d'actifs 3D avec un transformeur autorégressif
AssetFormer: Modular 3D Assets Generation with Autoregressive Transformer
February 12, 2026
papers.authors: Lingting Zhu, Shengju Qian, Haidi Fan, Jiayu Dong, Zhenchao Jin, Siwei Zhou, Gen Dong, Xin Wang, Lequan Yu
cs.AI
papers.abstract
L'industrie numérique exige des actifs 3D modulaires de haute qualité et diversifiés, en particulier pour le contenu généré par les utilisateurs (CGU). Dans ce travail, nous présentons AssetFormer, un modèle autoregressif basé sur un Transformer conçu pour générer des actifs 3D modulaires à partir de descriptions textuelles. Notre étude pilote exploite des actifs modulaires réels collectés sur des plateformes en ligne. AssetFormer relève le défi de créer des actifs composés de primitives qui adhèrent à des paramètres de conception contraints pour diverses applications. En adaptant de manière innovante des techniques de séquençage et de décodage de modules inspirées des modèles de langage, notre approche améliore la qualité de la génération d'actifs via la modélisation autoregressive. Les résultats initiaux indiquent l'efficacité d'AssetFormer pour rationaliser la création d'actifs dans les scénarios de développement professionnel et de CGU. Ce travail présente un cadre flexible extensible à divers types d'actifs 3D modulaires, contribuant ainsi au domaine plus large de la génération de contenu 3D. Le code est disponible à l'adresse https://github.com/Advocate99/AssetFormer.
English
The digital industry demands high-quality, diverse modular 3D assets, especially for user-generated content~(UGC). In this work, we introduce AssetFormer, an autoregressive Transformer-based model designed to generate modular 3D assets from textual descriptions. Our pilot study leverages real-world modular assets collected from online platforms. AssetFormer tackles the challenge of creating assets composed of primitives that adhere to constrained design parameters for various applications. By innovatively adapting module sequencing and decoding techniques inspired by language models, our approach enhances asset generation quality through autoregressive modeling. Initial results indicate the effectiveness of AssetFormer in streamlining asset creation for professional development and UGC scenarios. This work presents a flexible framework extendable to various types of modular 3D assets, contributing to the broader field of 3D content generation. The code is available at https://github.com/Advocate99/AssetFormer.