ChatPaper.aiChatPaper

TreeMeshGPT: Geração Artística de Malhas com Sequenciamento Autoregressivo em Árvore

TreeMeshGPT: Artistic Mesh Generation with Autoregressive Tree Sequencing

March 14, 2025
Autores: Stefan Lionar, Jiabin Liang, Gim Hee Lee
cs.AI

Resumo

Apresentamos o TreeMeshGPT, um Transformer autorregressivo projetado para gerar malhas artísticas de alta qualidade alinhadas com nuvens de pontos de entrada. Em vez da previsão convencional do próximo token em Transformers autorregressivos, propomos uma nova Sequenciação de Árvore Autorregressiva, onde o próximo token de entrada é recuperado de uma estrutura de árvore que cresce dinamicamente, construída com base na adjacência triangular das faces dentro da malha. Nossa sequenciação permite que a malha se estenda localmente a partir da última face triangular gerada em cada etapa, reduzindo assim a dificuldade de treinamento e melhorando a qualidade da malha. Nossa abordagem representa cada face triangular com dois tokens, alcançando uma taxa de compressão de aproximadamente 22% em comparação com a tokenização ingênua de faces. Essa tokenização eficiente permite que nosso modelo gere malhas artísticas altamente detalhadas com forte condicionamento da nuvem de pontos, superando métodos anteriores em capacidade e fidelidade. Além disso, nosso método gera malhas com fortes restrições de orientação normal, minimizando normais invertidas comumente encontradas em métodos anteriores. Nossos experimentos mostram que o TreeMeshGPT melhora a qualidade da geração de malhas com detalhes refinados e consistência na orientação normal.
English
We introduce TreeMeshGPT, an autoregressive Transformer designed to generate high-quality artistic meshes aligned with input point clouds. Instead of the conventional next-token prediction in autoregressive Transformer, we propose a novel Autoregressive Tree Sequencing where the next input token is retrieved from a dynamically growing tree structure that is built upon the triangle adjacency of faces within the mesh. Our sequencing enables the mesh to extend locally from the last generated triangular face at each step, and therefore reduces training difficulty and improves mesh quality. Our approach represents each triangular face with two tokens, achieving a compression rate of approximately 22% compared to the naive face tokenization. This efficient tokenization enables our model to generate highly detailed artistic meshes with strong point cloud conditioning, surpassing previous methods in both capacity and fidelity. Furthermore, our method generates mesh with strong normal orientation constraints, minimizing flipped normals commonly encountered in previous methods. Our experiments show that TreeMeshGPT enhances the mesh generation quality with refined details and normal orientation consistency.

Summary

AI-Generated Summary

PDF62March 17, 2025