Streifen als Tokens: Künstlergitter-Erzeugung mit nativer UV-Segmentierung
Strips as Tokens: Artist Mesh Generation with Native UV Segmentation
April 10, 2026
Autoren: Rui Xu, Dafei Qin, Kaichun Qiao, Qiujie Dong, Huaijin Pi, Qixuan Zhang, Longwen Zhang, Lan Xu, Jingyi Yu, Wenping Wang, Taku Komura
cs.AI
Zusammenfassung
Jüngste Fortschritte bei autoregressiven Transformern haben ein bemerkenswertes Potenzial für die Erstellung von meshes in Künstlerqualität gezeigt. Die von bestehenden Methoden verwendeten Token-Ordering-Strategien erfüllen jedoch in der Regel nicht die Standards professioneller Künstler, da koordinatenbasierte Sortierung ineffizient lange Sequenzen erzeugt und patchbasierte Heuristiken den kontinuierlichen Kantenfluss und die strukturelle Regelmäßigkeit stören, die für hochwertiges Modeling essenziell sind. Um diese Einschränkungen zu adressieren, schlagen wir Strips as Tokens (SATO) vor, ein neuartiges Framework mit einer Token-Ordering-Strategie, die von Dreiecksstreifen (Triangle Strips) inspiriert ist. Indem wir die Sequenz als verbundene Kette von Flächen konstruieren, die UV-Grenzen explizit kodiert, bewahrt unsere Methode auf natürliche Weise den organisierten Kantenfluss und das semantische Layout, die für künstlerisch erstellte Meshes charakteristisch sind. Ein entscheidender Vorteil dieser Formulierung ist ihre einheitliche Repräsentation, die es ermöglicht, dieselbe Token-Sequenz entweder in ein Dreiecks- oder ein Vierecksnetz (Quad-Mesh) zu dekodieren. Diese Flexibilität erleichtert das gemeinsame Trainieren mit beiden Datentypen: Große Mengen an Dreiecksdaten liefern grundlegende strukturelle Priors, während hochwertige Quad-Daten die geometrische Regularität der Ausgaben verbessern. Umfangreiche Experimente zeigen, dass SATO frühere Methoden durchgängig in Bezug auf geometrische Qualität, strukturelle Kohärenz und UV-Segmentierung übertrifft.
English
Recent advancements in autoregressive transformers have demonstrated remarkable potential for generating artist-quality meshes. However, the token ordering strategies employed by existing methods typically fail to meet professional artist standards, where coordinate-based sorting yields inefficiently long sequences, and patch-based heuristics disrupt the continuous edge flow and structural regularity essential for high-quality modeling. To address these limitations, we propose Strips as Tokens (SATO), a novel framework with a token ordering strategy inspired by triangle strips. By constructing the sequence as a connected chain of faces that explicitly encodes UV boundaries, our method naturally preserves the organized edge flow and semantic layout characteristic of artist-created meshes. A key advantage of this formulation is its unified representation, enabling the same token sequence to be decoded into either a triangle or quadrilateral mesh. This flexibility facilitates joint training on both data types: large-scale triangle data provides fundamental structural priors, while high-quality quad data enhances the geometric regularity of the outputs. Extensive experiments demonstrate that SATO consistently outperforms prior methods in terms of geometric quality, structural coherence, and UV segmentation.