Strips como Tokens: Geração de Malhas Artísticas com Segmentação UV Nativa
Strips as Tokens: Artist Mesh Generation with Native UV Segmentation
April 10, 2026
Autores: Rui Xu, Dafei Qin, Kaichun Qiao, Qiujie Dong, Huaijin Pi, Qixuan Zhang, Longwen Zhang, Lan Xu, Jingyi Yu, Wenping Wang, Taku Komura
cs.AI
Resumo
Os avanços recentes em transformadores autorregressivos demonstraram um potencial notável para gerar malhas de qualidade profissional. No entanto, as estratégias de ordenação de *tokens* empregadas pelos métodos existentes geralmente não atendem aos padrões dos artistas, em que a ordenação baseada em coordenadas gera sequências ineficientemente longas, e as heurísticas baseadas em *patches* perturbam o fluxo contínuo de arestas e a regularidade estrutural essenciais para uma modelagem de alta qualidade. Para superar essas limitações, propomos o *Strips as Tokens* (SATO), uma nova estrutura com uma estratégia de ordenação de *tokens* inspirada em *triangle strips*. Ao construir a sequência como uma cadeia conectada de faces que codifica explicitamente os limites UV, nosso método preserva naturalmente o fluxo organizado de arestas e o *layout* semântico característicos das malhas criadas por artistas. Uma vantagem fundamental desta formulação é sua representação unificada, permitindo que a mesma sequência de *tokens* seja decodificada em uma malha triangular ou quadrangular. Esta flexibilidade facilita o treinamento conjunto em ambos os tipos de dados: dados triangulares em larga escala fornecem *priors* estruturais fundamentais, enquanto dados quadrangulares de alta qualidade melhoram a regularidade geométrica das saídas. Experimentos extensivos demonstram que o SATO supera consistentemente os métodos anteriores em termos de qualidade geométrica, coerência estrutural e segmentação UV.
English
Recent advancements in autoregressive transformers have demonstrated remarkable potential for generating artist-quality meshes. However, the token ordering strategies employed by existing methods typically fail to meet professional artist standards, where coordinate-based sorting yields inefficiently long sequences, and patch-based heuristics disrupt the continuous edge flow and structural regularity essential for high-quality modeling. To address these limitations, we propose Strips as Tokens (SATO), a novel framework with a token ordering strategy inspired by triangle strips. By constructing the sequence as a connected chain of faces that explicitly encodes UV boundaries, our method naturally preserves the organized edge flow and semantic layout characteristic of artist-created meshes. A key advantage of this formulation is its unified representation, enabling the same token sequence to be decoded into either a triangle or quadrilateral mesh. This flexibility facilitates joint training on both data types: large-scale triangle data provides fundamental structural priors, while high-quality quad data enhances the geometric regularity of the outputs. Extensive experiments demonstrate that SATO consistently outperforms prior methods in terms of geometric quality, structural coherence, and UV segmentation.