Fast3Dcache: 학습 없이 가능한 3D 기하 형상 합성 가속
Fast3Dcache: Training-free 3D Geometry Synthesis Acceleration
November 27, 2025
저자: Mengyu Yang, Yanming Yang, Chenyi Xu, Chenxi Song, Yufan Zuo, Tong Zhao, Ruibo Li, Chi Zhang
cs.AI
초록
확산 모델은 2D 이미지, 비디오, 3D 형상 등 다양한 양상에서 인상적인 생성 품질을 달성했지만, 반복적인 노이즈 제거 프로세스로 인해 추론 시 계산 비용이 높은 문제가 remains. 최근 캐싱 기반 방법들이 2D 및 비디오 생성 속도를 높이기 위해 중복 계산을 효과적으로 재사용하고 있으나, 이러한 기법을 3D 확산 모델에 직접 적용하면 기하학적 일관성이 심각하게 훼손될 수 있습니다. 3D 합성에서는 캐시된 잠재 특징의 미세한 수치 오류조차 누적되어 구조적 아티팩트와 위상학적 불일치를 초래합니다. 이러한 한계를 극복하기 위해 본 연구에서는 추론 가속화와 기하학적 정확도 보존을 동시에達成하는 학습 불필요한 기하학 인식 캐싱 프레임워크인 Fast3Dcache를 제안합니다. 우리의 방법은 복셀 안정화 패턴에 따라 캐시 할당량을 동적으로 결정하는 예측 캐싱 스케줄러 제약(PCSC)과 속도 크기 및 가속도 기준에 따라 재사용할 안정적인 특징을 선택하는 시공간 안정성 기준(SSC)을 도입합니다. 포괄적 실험 결과, Fast3Dcache는 Chamfer Distance(2.48%) 및 F-Score(1.95%) 기준 기하학적 품질 저하를 최소화하면서 추론 속도를 최대 27.12% 가속화하고 FLOPs를 54.8% 절감하는 것으로 나타났습니다.
English
Diffusion models have achieved impressive generative quality across modalities like 2D images, videos, and 3D shapes, but their inference remains computationally expensive due to the iterative denoising process. While recent caching-based methods effectively reuse redundant computations to speed up 2D and video generation, directly applying these techniques to 3D diffusion models can severely disrupt geometric consistency. In 3D synthesis, even minor numerical errors in cached latent features accumulate, causing structural artifacts and topological inconsistencies. To overcome this limitation, we propose Fast3Dcache, a training-free geometry-aware caching framework that accelerates 3D diffusion inference while preserving geometric fidelity. Our method introduces a Predictive Caching Scheduler Constraint (PCSC) to dynamically determine cache quotas according to voxel stabilization patterns and a Spatiotemporal Stability Criterion (SSC) to select stable features for reuse based on velocity magnitude and acceleration criterion. Comprehensive experiments show that Fast3Dcache accelerates inference significantly, achieving up to a 27.12% speed-up and a 54.8% reduction in FLOPs, with minimal degradation in geometric quality as measured by Chamfer Distance (2.48%) and F-Score (1.95%).