PrimitiveAnything: Generazione di Assemblaggi di Primitivi 3D Creati dall'Uomo con Trasformatori Auto-Regressivi
PrimitiveAnything: Human-Crafted 3D Primitive Assembly Generation with Auto-Regressive Transformer
May 7, 2025
Autori: Jingwen Ye, Yuze He, Yanning Zhou, Yiqin Zhu, Kaiwen Xiao, Yong-Jin Liu, Wei Yang, Xiao Han
cs.AI
Abstract
L'astrazione delle primitive di forma, che scompone forme 3D complesse in elementi geometrici semplici, svolge un ruolo cruciale nella cognizione visiva umana e trova ampie applicazioni nella visione artificiale e nella grafica. Sebbene i recenti progressi nella generazione di contenuti 3D abbiano mostrato risultati notevoli, i metodi esistenti per l'astrazione delle primitive si basano su ottimizzazioni geometriche con una comprensione semantica limitata o apprendono da dataset di piccole dimensioni e specifici per categoria, trovando difficoltà a generalizzare attraverso diverse categorie di forme. Presentiamo PrimitiveAnything, un nuovo framework che riformula l'astrazione delle primitive di forma come un compito di generazione di assemblaggi di primitive. PrimitiveAnything include un trasformatore di primitive condizionato dalla forma per la generazione auto-regressiva e uno schema di parametrizzazione privo di ambiguità per rappresentare in modo unificato più tipi di primitive. Il framework proposto apprende direttamente il processo di assemblaggio delle primitive da astrazioni su larga scala create dall'uomo, consentendogli di catturare come gli esseri umani scompongono forme complesse in elementi primitivi. Attraverso esperimenti estensivi, dimostriamo che PrimitiveAnything può generare assemblaggi di primitive di alta qualità che si allineano meglio alla percezione umana, mantenendo al contempo la fedeltà geometrica attraverso diverse categorie di forme. Questo approccio beneficia varie applicazioni 3D e mostra potenziale per abilitare contenuti generati dagli utenti (UGC) basati su primitive nei giochi. Pagina del progetto: https://primitiveanything.github.io
English
Shape primitive abstraction, which decomposes complex 3D shapes into simple
geometric elements, plays a crucial role in human visual cognition and has
broad applications in computer vision and graphics. While recent advances in 3D
content generation have shown remarkable progress, existing primitive
abstraction methods either rely on geometric optimization with limited semantic
understanding or learn from small-scale, category-specific datasets, struggling
to generalize across diverse shape categories. We present PrimitiveAnything, a
novel framework that reformulates shape primitive abstraction as a primitive
assembly generation task. PrimitiveAnything includes a shape-conditioned
primitive transformer for auto-regressive generation and an ambiguity-free
parameterization scheme to represent multiple types of primitives in a unified
manner. The proposed framework directly learns the process of primitive
assembly from large-scale human-crafted abstractions, enabling it to capture
how humans decompose complex shapes into primitive elements. Through extensive
experiments, we demonstrate that PrimitiveAnything can generate high-quality
primitive assemblies that better align with human perception while maintaining
geometric fidelity across diverse shape categories. It benefits various 3D
applications and shows potential for enabling primitive-based user-generated
content (UGC) in games. Project page: https://primitiveanything.github.io