ChatPaper.aiChatPaper

UltraShape 1.0: 확장 가능한 기하학적 정제를 통한 고충실도 3D 형상 생성

UltraShape 1.0: High-Fidelity 3D Shape Generation via Scalable Geometric Refinement

December 24, 2025
저자: Tanghui Jia, Dongyu Yan, Dehao Hao, Yang Li, Kaiyi Zhang, Xianyi He, Lanjiong Li, Jinnan Chen, Lutao Jiang, Qishen Yin, Long Quan, Ying-Cong Chen, Li Yuan
cs.AI

초록

본 보고서에서는 고품질 3D 형상 생성을 위한 확장 가능한 3D 디퓨전 프레임워크인 UltraShape 1.0을 소개한다. 제안하는 접근법은 두 단계 생성 파이프라인을 채택한다: 먼저 개략적인 전역 구조가 합성된 다음, 이를 정제하여 디테일하고 고품질의 형상을 생성한다. 신뢰할 수 있는 3D 생성을 지원하기 위해, 새로운 수밀(watertight) 처리 방법과 고품질 데이터 필터링을 포함하는 포괄적인 데이터 처리 파이프라인을 개발하였다. 이 파이프라인은 저품질 샘플을 제거하고, 구멍을 메우며, 얇은 구조를 두껍게 하는 동시에 세밀한 형상 디테일을 보존함으로써 공개된 3D 데이터셋의 기하학적 품질을 향상시킨다. 미세한 형상 정제를 가능하게 하기 위해, 디퓨전 과정에서 공간적 위치 지정과 기하학적 디테일 합성을 분리한다. 이를 위해 고정된 공간 위치에서 복셀 기반 정제를 수행하며, 여기서 조악한 형상에서 도출된 복셀 쿼리는 RoPE를 통해 인코딩된 명시적 위치 기준점을 제공하여 디퓨전 모델이 축소되고 구조화된 해결 공간 내에서 지역적 기하학적 디테일 합성에 집중할 수 있게 한다. 우리 모델은 공개된 3D 데이터셋만으로 훈련되었으며, 제한된 훈련 자원에도 불구하고 우수한 기하학적 품질을 달성한다. 광범위한 평가를 통해 UltraShape 1.0이 데이터 처리 품질과 형상 생성 모두에서 기존 오픈소스 방법들과 경쟁력 있는 성능을 보임을 입증한다. 향후 연구를 지원하기 위해 모든 코드와 훈련된 모델을 공개할 예정이다.
English
In this report, we introduce UltraShape 1.0, a scalable 3D diffusion framework for high-fidelity 3D geometry generation. The proposed approach adopts a two-stage generation pipeline: a coarse global structure is first synthesized and then refined to produce detailed, high-quality geometry. To support reliable 3D generation, we develop a comprehensive data processing pipeline that includes a novel watertight processing method and high-quality data filtering. This pipeline improves the geometric quality of publicly available 3D datasets by removing low-quality samples, filling holes, and thickening thin structures, while preserving fine-grained geometric details. To enable fine-grained geometry refinement, we decouple spatial localization from geometric detail synthesis in the diffusion process. We achieve this by performing voxel-based refinement at fixed spatial locations, where voxel queries derived from coarse geometry provide explicit positional anchors encoded via RoPE, allowing the diffusion model to focus on synthesizing local geometric details within a reduced, structured solution space. Our model is trained exclusively on publicly available 3D datasets, achieving strong geometric quality despite limited training resources. Extensive evaluations demonstrate that UltraShape 1.0 performs competitively with existing open-source methods in both data processing quality and geometry generation. All code and trained models will be released to support future research.
PDF141January 1, 2026