UltraShape 1.0 : Génération de formes 3D haute fidélité par raffinement géométrique évolutif
UltraShape 1.0: High-Fidelity 3D Shape Generation via Scalable Geometric Refinement
December 24, 2025
papers.authors: Tanghui Jia, Dongyu Yan, Dehao Hao, Yang Li, Kaiyi Zhang, Xianyi He, Lanjiong Li, Jinnan Chen, Lutao Jiang, Qishen Yin, Long Quan, Ying-Cong Chen, Li Yuan
cs.AI
papers.abstract
Dans ce rapport, nous présentons UltraShape 1.0, un cadre de diffusion 3D évolutif pour la génération de géométries 3D haute fidélité. L'approche proposée adopte un pipeline de génération en deux étapes : une structure globale grossière est d'abord synthétisée, puis affinée pour produire une géométrie détaillée et de haute qualité. Pour soutenir une génération 3D fiable, nous avons développé un pipeline complet de traitement des données qui inclut une nouvelle méthode de traitement de l'étanchéité et un filtrage de données de haute qualité. Ce pipeline améliore la qualité géométrique des ensembles de données 3D publiquement disponibles en supprimant les échantillons de faible qualité, en comblant les trous et en épaississant les structures minces, tout en préservant les détails géométriques fins.
Pour permettre un affinage granulaire de la géométrie, nous découplons la localisation spatiale de la synthèse des détails géométriques dans le processus de diffusion. Nous y parvenons en effectuant un raffinement basé sur des voxels à des emplacements spatiaux fixes. Des requêtes voxel dérivées de la géométrie grossière fournissent des ancres positionnelles explicites encodées via RoPE, permettant au modèle de diffusion de se concentrer sur la synthèse de détails géométriques locaux dans un espace de solution structuré et réduit. Notre modèle est entraîné exclusivement sur des ensembles de données 3D publics, atteignant une forte qualité géométrique malgré des ressources d'entraînement limitées.
Des évaluations approfondies démontrent qu'UltraShape 1.0 rivalise avec les méthodes open-source existantes, à la fois en qualité de traitement des données et en génération de géométrie. L'intégralité du code et des modèles entraînés sera publiée pour soutenir les recherches futures.
English
In this report, we introduce UltraShape 1.0, a scalable 3D diffusion framework for high-fidelity 3D geometry generation. The proposed approach adopts a two-stage generation pipeline: a coarse global structure is first synthesized and then refined to produce detailed, high-quality geometry. To support reliable 3D generation, we develop a comprehensive data processing pipeline that includes a novel watertight processing method and high-quality data filtering. This pipeline improves the geometric quality of publicly available 3D datasets by removing low-quality samples, filling holes, and thickening thin structures, while preserving fine-grained geometric details. To enable fine-grained geometry refinement, we decouple spatial localization from geometric detail synthesis in the diffusion process. We achieve this by performing voxel-based refinement at fixed spatial locations, where voxel queries derived from coarse geometry provide explicit positional anchors encoded via RoPE, allowing the diffusion model to focus on synthesizing local geometric details within a reduced, structured solution space. Our model is trained exclusively on publicly available 3D datasets, achieving strong geometric quality despite limited training resources. Extensive evaluations demonstrate that UltraShape 1.0 performs competitively with existing open-source methods in both data processing quality and geometry generation. All code and trained models will be released to support future research.