Tiras como Tokens: Generación de Mallas para Artistas con Segmentación UV Nativa
Strips as Tokens: Artist Mesh Generation with Native UV Segmentation
April 10, 2026
Autores: Rui Xu, Dafei Qin, Kaichun Qiao, Qiujie Dong, Huaijin Pi, Qixuan Zhang, Longwen Zhang, Lan Xu, Jingyi Yu, Wenping Wang, Taku Komura
cs.AI
Resumen
Los recientes avances en transformadores autoregresivos han demostrado un potencial notable para generar mallas de calidad artística. Sin embargo, las estrategias de ordenación de *tokens* empleadas por los métodos existentes generalmente no cumplen con los estándares profesionales, donde la ordenación basada en coordenadas produce secuencias ineficientemente largas, y las heurísticas basadas en parches interrumpen el flujo continuo de aristas y la regularidad estructural esenciales para un modelado de alta calidad. Para abordar estas limitaciones, proponemos *Strips as Tokens* (SATO), un novedoso marco con una estrategia de ordenación de *tokens* inspirada en las tiras de triángulos. Al construir la secuencia como una cadena conectada de caras que codifica explícitamente los límites UV, nuestro método preserva naturalmente el flujo organizado de aristas y la disposición semántica característica de las mallas creadas por artistas. Una ventaja clave de esta formulación es su representación unificada, que permite que la misma secuencia de *tokens* se decodifique en una malla de triángulos o de cuadriláteros. Esta flexibilidad facilita el entrenamiento conjunto en ambos tipos de datos: los datos triangulares a gran escala proporcionan *priors* estructurales fundamentales, mientras que los datos cuadrangulares de alta calidad mejoran la regularidad geométrica de las salidas. Experimentos exhaustivos demuestran que SATO supera consistentemente a los métodos anteriores en términos de calidad geométrica, coherencia estructural y segmentación UV.
English
Recent advancements in autoregressive transformers have demonstrated remarkable potential for generating artist-quality meshes. However, the token ordering strategies employed by existing methods typically fail to meet professional artist standards, where coordinate-based sorting yields inefficiently long sequences, and patch-based heuristics disrupt the continuous edge flow and structural regularity essential for high-quality modeling. To address these limitations, we propose Strips as Tokens (SATO), a novel framework with a token ordering strategy inspired by triangle strips. By constructing the sequence as a connected chain of faces that explicitly encodes UV boundaries, our method naturally preserves the organized edge flow and semantic layout characteristic of artist-created meshes. A key advantage of this formulation is its unified representation, enabling the same token sequence to be decoded into either a triangle or quadrilateral mesh. This flexibility facilitates joint training on both data types: large-scale triangle data provides fundamental structural priors, while high-quality quad data enhances the geometric regularity of the outputs. Extensive experiments demonstrate that SATO consistently outperforms prior methods in terms of geometric quality, structural coherence, and UV segmentation.