ChatPaper.aiChatPaper

Fast3Dcache: Ускорение синтеза 3D-геометрии без обучения

Fast3Dcache: Training-free 3D Geometry Synthesis Acceleration

November 27, 2025
Авторы: Mengyu Yang, Yanming Yang, Chenyi Xu, Chenxi Song, Yufan Zuo, Tong Zhao, Ruibo Li, Chi Zhang
cs.AI

Аннотация

Диффузионные модели достигли впечатляющего качества генерации в различных модальностях, таких как 2D-изображения, видео и 3D-формы, но их вывод остается вычислительно дорогим из-за итеративного процесса шумоподавления. В то время как современные методы на основе кэширования эффективно переиспользуют избыточные вычисления для ускорения генерации 2D-изображений и видео, прямое применение этих техник к 3D-диффузионным моделям может серьезно нарушить геометрическую согласованность. В 3D-синтезе даже незначительные численные ошибки в кэшированных латентных признаках накапливаются, вызывая структурные артефакты и топологические несоответствия. Чтобы преодолеть это ограничение, мы предлагаем Fast3Dcache — не требующую дообучения геометрически осознанную систему кэширования, которая ускоряет вывод 3D-диффузионных моделей, сохраняя геометрическую точность. Наш метод вводит Ограничение Планировщика Прогнозирующего Кэширования (Predictive Caching Scheduler Constraint, PCSC) для динамического определения квот кэширования в соответствии с паттернами стабилизации вокселей и Пространственно-временной Критерий Стабильности (Spatiotemporal Stability Criterion, SSC) для выбора стабильных признаков для повторного использования на основе критериев величины скорости и ускорения. Комплексные эксперименты показывают, что Fast3Dcache значительно ускоряет вывод, достигая до 27.12% ускорения и 54.8% сокращения FLOPs при минимальной деградации геометрического качества, измеряемой по расстоянию Чемфера (2.48%) и F-мере (1.95%).
English
Diffusion models have achieved impressive generative quality across modalities like 2D images, videos, and 3D shapes, but their inference remains computationally expensive due to the iterative denoising process. While recent caching-based methods effectively reuse redundant computations to speed up 2D and video generation, directly applying these techniques to 3D diffusion models can severely disrupt geometric consistency. In 3D synthesis, even minor numerical errors in cached latent features accumulate, causing structural artifacts and topological inconsistencies. To overcome this limitation, we propose Fast3Dcache, a training-free geometry-aware caching framework that accelerates 3D diffusion inference while preserving geometric fidelity. Our method introduces a Predictive Caching Scheduler Constraint (PCSC) to dynamically determine cache quotas according to voxel stabilization patterns and a Spatiotemporal Stability Criterion (SSC) to select stable features for reuse based on velocity magnitude and acceleration criterion. Comprehensive experiments show that Fast3Dcache accelerates inference significantly, achieving up to a 27.12% speed-up and a 54.8% reduction in FLOPs, with minimal degradation in geometric quality as measured by Chamfer Distance (2.48%) and F-Score (1.95%).
PDF11December 2, 2025