ChatPaper.aiChatPaper

UltraShape 1.0: Geração de Formas 3D de Alta Fidelidade por meio de Refinamento Geométrico Escalável

UltraShape 1.0: High-Fidelity 3D Shape Generation via Scalable Geometric Refinement

December 24, 2025
Autores: Tanghui Jia, Dongyu Yan, Dehao Hao, Yang Li, Kaiyi Zhang, Xianyi He, Lanjiong Li, Jinnan Chen, Lutao Jiang, Qishen Yin, Long Quan, Ying-Cong Chen, Li Yuan
cs.AI

Resumo

Neste relatório, apresentamos o UltraShape 1.0, uma estrutura de difusão 3D escalável para geração de geometria 3D de alta fidelidade. A abordagem proposta adota um pipeline de geração em dois estágios: primeiro, uma estrutura global grosseira é sintetizada e, em seguida, refinada para produzir uma geometria detalhada e de alta qualidade. Para suportar uma geração 3D confiável, desenvolvemos um pipeline abrangente de processamento de dados que inclui um novo método de processamento *watertight* e uma filtragem de dados de alta qualidade. Este pipeline melhora a qualidade geométrica de conjuntos de dados 3D publicamente disponíveis, removendo amostras de baixa qualidade, preenchendo buracos e espessando estruturas finas, preservando ao mesmo tempo detalhes geométricos de granularidade fina. Para permitir um refinamento de geometria de granularidade fina, desacoplamos a localização espacial da síntese de detalhes geométricos no processo de difusão. Conseguimos isso realizando um refinamento baseado em voxel em localizações espaciais fixas, onde consultas de voxel derivadas da geometria grosseira fornecem âncoras posicionais explícitas codificadas via RoPE, permitindo que o modelo de difusão se concentre na síntese de detalhes geométricos locais dentro de um espaço de solução reduzido e estruturado. Nosso modelo foi treinado exclusivamente em conjuntos de dados 3D publicamente disponíveis, alcançando uma forte qualidade geométrica apesar de recursos de treinamento limitados. Avaliações extensivas demonstram que o UltraShape 1.0 tem um desempenho competitivo com os métodos de código aberto existentes, tanto na qualidade de processamento de dados quanto na geração de geometria. Todo o código e os modelos treinados serão disponibilizados para apoiar pesquisas futuras.
English
In this report, we introduce UltraShape 1.0, a scalable 3D diffusion framework for high-fidelity 3D geometry generation. The proposed approach adopts a two-stage generation pipeline: a coarse global structure is first synthesized and then refined to produce detailed, high-quality geometry. To support reliable 3D generation, we develop a comprehensive data processing pipeline that includes a novel watertight processing method and high-quality data filtering. This pipeline improves the geometric quality of publicly available 3D datasets by removing low-quality samples, filling holes, and thickening thin structures, while preserving fine-grained geometric details. To enable fine-grained geometry refinement, we decouple spatial localization from geometric detail synthesis in the diffusion process. We achieve this by performing voxel-based refinement at fixed spatial locations, where voxel queries derived from coarse geometry provide explicit positional anchors encoded via RoPE, allowing the diffusion model to focus on synthesizing local geometric details within a reduced, structured solution space. Our model is trained exclusively on publicly available 3D datasets, achieving strong geometric quality despite limited training resources. Extensive evaluations demonstrate that UltraShape 1.0 performs competitively with existing open-source methods in both data processing quality and geometry generation. All code and trained models will be released to support future research.
PDF314March 23, 2026