Fast3Dcache: 学習不要な3Dジオメトリ合成高速化
Fast3Dcache: Training-free 3D Geometry Synthesis Acceleration
November 27, 2025
著者: Mengyu Yang, Yanming Yang, Chenyi Xu, Chenxi Song, Yufan Zuo, Tong Zhao, Ruibo Li, Chi Zhang
cs.AI
要旨
拡散モデルは、2D画像、ビデオ、3D形状などの様々なモダリティで印象的な生成品質を達成しているが、その推論は反復的なノイズ除去プロセスにより計算コストが高いままである。近年のキャッシュベースの手法は、冗長な計算を効果的に再利用して2Dおよびビデオ生成を高速化するが、これらの技術を3D拡散モデルに直接適用すると、幾何学的な一貫性が深刻に損なわれる可能性がある。3D合成においては、キャッシュされた潜在特徴におけるわずかな数値誤差でさえ蓄積し、構造的なアーティファクトや位相的不整合を引き起こす。この制限を克服するため、我々は訓練不要の幾何学認識キャッシュフレームワークであるFast3Dcacheを提案する。これは3D拡散推論を高速化しつつ幾何学的忠実度を保持する。本手法は、ボクセル安定化パターンに応じてキャッシュ割当量を動的に決定する予測的キャッシュスケジューラ制約(PCSC)と、速度の大きさと加速度基準に基づいて再利用する安定特徴を選択する時空間的安定性基準(SSC)を導入する。包括的な実験により、Fast3Dcacheが推論を大幅に高速化し、最大27.12%の速度向上と54.8%のFLOPs削減を達成し、Chamfer距離(2.48%)およびF-Score(1.95%)で測定される幾何学的品質の劣化を最小限に抑えることが示された。
English
Diffusion models have achieved impressive generative quality across modalities like 2D images, videos, and 3D shapes, but their inference remains computationally expensive due to the iterative denoising process. While recent caching-based methods effectively reuse redundant computations to speed up 2D and video generation, directly applying these techniques to 3D diffusion models can severely disrupt geometric consistency. In 3D synthesis, even minor numerical errors in cached latent features accumulate, causing structural artifacts and topological inconsistencies. To overcome this limitation, we propose Fast3Dcache, a training-free geometry-aware caching framework that accelerates 3D diffusion inference while preserving geometric fidelity. Our method introduces a Predictive Caching Scheduler Constraint (PCSC) to dynamically determine cache quotas according to voxel stabilization patterns and a Spatiotemporal Stability Criterion (SSC) to select stable features for reuse based on velocity magnitude and acceleration criterion. Comprehensive experiments show that Fast3Dcache accelerates inference significantly, achieving up to a 27.12% speed-up and a 54.8% reduction in FLOPs, with minimal degradation in geometric quality as measured by Chamfer Distance (2.48%) and F-Score (1.95%).