ChatPaper.aiChatPaper

Fast3Dcache: Accelerazione Addestramento-free della Sintesi di Geometria 3D

Fast3Dcache: Training-free 3D Geometry Synthesis Acceleration

November 27, 2025
Autori: Mengyu Yang, Yanming Yang, Chenyi Xu, Chenxi Song, Yufan Zuo, Tong Zhao, Ruibo Li, Chi Zhang
cs.AI

Abstract

I modelli di diffusione hanno ottenuto impressionanti risultati generativi in diverse modalità come immagini 2D, video e forme 3D, ma la loro inferenza rimane computazionalmente costosa a causa del processo iterativo di denoising. Sebbene i recenti metodi basati sulla cache permettano di riutilizzare efficacemente calcoli ridondanti per accelerare la generazione di contenuti 2D e video, l'applicazione diretta di queste tecniche ai modelli di diffusione 3D può compromettere gravemente la coerenza geometrica. Nella sintesi 3D, anche piccoli errori numerici nelle feature latenti memorizzate nella cache si accumulano, causando artefatti strutturali e inconsistenze topologiche. Per superare questa limitazione, proponiamo Fast3Dcache, un framework di caching training-free e geometricamente consapevole che accelera l'inferenza della diffusione 3D preservando la fedeltà geometrica. Il nostro metodo introduce un Vincolo di Schedulazione della Cache Predittiva (PCSC) per determinare dinamicamente le quote di cache in base ai modelli di stabilizzazione dei voxel e un Criterio di Stabilità Spazio-Temporale (SSC) per selezionare le feature stabili da riutilizzare basandosi sulla magnitudine della velocità e su un criterio di accelerazione. Esperimenti completi dimostrano che Fast3Dcache accelera significativamente l'inferenza, raggiungendo un miglioramento fino al 27,12% nella velocità e una riduzione del 54,8% nelle FLOP, con un degrado minimo della qualità geometrica misurato tramite Chamfer Distance (2,48%) e F-Score (1,95%).
English
Diffusion models have achieved impressive generative quality across modalities like 2D images, videos, and 3D shapes, but their inference remains computationally expensive due to the iterative denoising process. While recent caching-based methods effectively reuse redundant computations to speed up 2D and video generation, directly applying these techniques to 3D diffusion models can severely disrupt geometric consistency. In 3D synthesis, even minor numerical errors in cached latent features accumulate, causing structural artifacts and topological inconsistencies. To overcome this limitation, we propose Fast3Dcache, a training-free geometry-aware caching framework that accelerates 3D diffusion inference while preserving geometric fidelity. Our method introduces a Predictive Caching Scheduler Constraint (PCSC) to dynamically determine cache quotas according to voxel stabilization patterns and a Spatiotemporal Stability Criterion (SSC) to select stable features for reuse based on velocity magnitude and acceleration criterion. Comprehensive experiments show that Fast3Dcache accelerates inference significantly, achieving up to a 27.12% speed-up and a 54.8% reduction in FLOPs, with minimal degradation in geometric quality as measured by Chamfer Distance (2.48%) and F-Score (1.95%).
PDF11December 2, 2025