ChatPaper.aiChatPaper

PrimitiveAnything: Generazione di Assemblaggi di Primitivi 3D Creati dall'Uomo con Trasformatori Auto-Regressivi

PrimitiveAnything: Human-Crafted 3D Primitive Assembly Generation with Auto-Regressive Transformer

May 7, 2025
Autori: Jingwen Ye, Yuze He, Yanning Zhou, Yiqin Zhu, Kaiwen Xiao, Yong-Jin Liu, Wei Yang, Xiao Han
cs.AI

Abstract

L'astrazione delle primitive di forma, che scompone forme 3D complesse in elementi geometrici semplici, svolge un ruolo cruciale nella cognizione visiva umana e trova ampie applicazioni nella visione artificiale e nella grafica. Sebbene i recenti progressi nella generazione di contenuti 3D abbiano mostrato risultati notevoli, i metodi esistenti per l'astrazione delle primitive si basano su ottimizzazioni geometriche con una comprensione semantica limitata o apprendono da dataset di piccole dimensioni e specifici per categoria, trovando difficoltà a generalizzare attraverso diverse categorie di forme. Presentiamo PrimitiveAnything, un nuovo framework che riformula l'astrazione delle primitive di forma come un compito di generazione di assemblaggi di primitive. PrimitiveAnything include un trasformatore di primitive condizionato dalla forma per la generazione auto-regressiva e uno schema di parametrizzazione privo di ambiguità per rappresentare in modo unificato più tipi di primitive. Il framework proposto apprende direttamente il processo di assemblaggio delle primitive da astrazioni su larga scala create dall'uomo, consentendogli di catturare come gli esseri umani scompongono forme complesse in elementi primitivi. Attraverso esperimenti estensivi, dimostriamo che PrimitiveAnything può generare assemblaggi di primitive di alta qualità che si allineano meglio alla percezione umana, mantenendo al contempo la fedeltà geometrica attraverso diverse categorie di forme. Questo approccio beneficia varie applicazioni 3D e mostra potenziale per abilitare contenuti generati dagli utenti (UGC) basati su primitive nei giochi. Pagina del progetto: https://primitiveanything.github.io
English
Shape primitive abstraction, which decomposes complex 3D shapes into simple geometric elements, plays a crucial role in human visual cognition and has broad applications in computer vision and graphics. While recent advances in 3D content generation have shown remarkable progress, existing primitive abstraction methods either rely on geometric optimization with limited semantic understanding or learn from small-scale, category-specific datasets, struggling to generalize across diverse shape categories. We present PrimitiveAnything, a novel framework that reformulates shape primitive abstraction as a primitive assembly generation task. PrimitiveAnything includes a shape-conditioned primitive transformer for auto-regressive generation and an ambiguity-free parameterization scheme to represent multiple types of primitives in a unified manner. The proposed framework directly learns the process of primitive assembly from large-scale human-crafted abstractions, enabling it to capture how humans decompose complex shapes into primitive elements. Through extensive experiments, we demonstrate that PrimitiveAnything can generate high-quality primitive assemblies that better align with human perception while maintaining geometric fidelity across diverse shape categories. It benefits various 3D applications and shows potential for enabling primitive-based user-generated content (UGC) in games. Project page: https://primitiveanything.github.io
PDF271May 8, 2025