Strips come Token: Generazione di Mesh per Artisti con Segmentazione UV Nativa
Strips as Tokens: Artist Mesh Generation with Native UV Segmentation
April 10, 2026
Autori: Rui Xu, Dafei Qin, Kaichun Qiao, Qiujie Dong, Huaijin Pi, Qixuan Zhang, Longwen Zhang, Lan Xu, Jingyi Yu, Wenping Wang, Taku Komura
cs.AI
Abstract
I recenti progressi nei trasformatori autoregressivi hanno dimostrato un notevole potenziale nella generazione di mesh di qualità artistica. Tuttavia, le strategie di ordinamento dei token impiegate dai metodi esistenti generalmente non soddisfano gli standard professionali degli artisti, dove l'ordinamento basato sulle coordinate produce sequenze inefficientemente lunghe, e le euristiche basate su patch interrompono il flusso continuo dei bordi e la regolarità strutturale essenziali per una modellazione di alta qualità. Per affrontare queste limitazioni, proponiamo Strips as Tokens (SATO), un nuovo framework con una strategia di ordinamento dei token ispirata alle strip triangolari. Costruendo la sequenza come una catena connessa di facce che codifica esplicitamente i contorni UV, il nostro metodo preserva naturalmente il flusso organizzato dei bordi e il layout semantico caratteristici delle mesh create dagli artisti. Un vantaggio chiave di questa formulazione è la sua rappresentazione unificata, che consente alla stessa sequenza di token di essere decodificata in una mesh triangolare o quadrilatera. Questa flessibilità facilita l'addestramento congiunto su entrambi i tipi di dati: i dati triangolari su larga scala forniscono prior strutturali fondamentali, mentre i dati quad di alta qualità migliorano la regolarità geometrica degli output. Esperimenti estesi dimostrano che SATO supera costantemente i metodi precedenti in termini di qualità geometrica, coerenza strutturale e segmentazione UV.
English
Recent advancements in autoregressive transformers have demonstrated remarkable potential for generating artist-quality meshes. However, the token ordering strategies employed by existing methods typically fail to meet professional artist standards, where coordinate-based sorting yields inefficiently long sequences, and patch-based heuristics disrupt the continuous edge flow and structural regularity essential for high-quality modeling. To address these limitations, we propose Strips as Tokens (SATO), a novel framework with a token ordering strategy inspired by triangle strips. By constructing the sequence as a connected chain of faces that explicitly encodes UV boundaries, our method naturally preserves the organized edge flow and semantic layout characteristic of artist-created meshes. A key advantage of this formulation is its unified representation, enabling the same token sequence to be decoded into either a triangle or quadrilateral mesh. This flexibility facilitates joint training on both data types: large-scale triangle data provides fundamental structural priors, while high-quality quad data enhances the geometric regularity of the outputs. Extensive experiments demonstrate that SATO consistently outperforms prior methods in terms of geometric quality, structural coherence, and UV segmentation.