ChatPaper.aiChatPaper

Fast3Dcache: Aceleración de la Síntesis de Geometría 3D sin Entrenamiento

Fast3Dcache: Training-free 3D Geometry Synthesis Acceleration

November 27, 2025
Autores: Mengyu Yang, Yanming Yang, Chenyi Xu, Chenxi Song, Yufan Zuo, Tong Zhao, Ruibo Li, Chi Zhang
cs.AI

Resumen

Los modelos de difusión han logrado una calidad generativa impresionante en diversas modalidades como imágenes 2D, vídeos y formas 3D, pero su inferencia sigue siendo computacionalmente costosa debido al proceso iterativo de eliminación de ruido. Si bien los métodos recientes basados en caché reutilizan eficazmente cálculos redundantes para acelerar la generación de contenido 2D y de vídeo, la aplicación directa de estas técnicas a los modelos de difusión 3D puede alterar gravemente la coherencia geométrica. En la síntesis 3D, incluso pequeños errores numéricos en las características latentes almacenadas en caché se acumulan, provocando artefactos estructurales e inconsistencias topológicas. Para superar esta limitación, proponemos Fast3Dcache, un marco de almacenamiento en caché consciente de la geometría que no requiere entrenamiento y acelera la inferencia de difusión 3D preservando la fidelidad geométrica. Nuestro método introduce una Restricción de Planificación de Caché Predictiva (PCSC) para determinar dinámicamente las cuotas de caché según los patrones de estabilización de vóxeles y un Criterio de Estabilidad Espaciotemporal (SSC) para seleccionar características estables para su reutilización basándose en la magnitud de velocidad y un criterio de aceleración. Experimentos exhaustivos demuestran que Fast3Dcache acelera significativamente la inferencia, logrando hasta un 27.12% de aceleración y una reducción del 54.8% en FLOPS, con una degradación mínima de la calidad geométrica medida mediante la Distancia de Chamfer (2.48%) y F-Score (1.95%).
English
Diffusion models have achieved impressive generative quality across modalities like 2D images, videos, and 3D shapes, but their inference remains computationally expensive due to the iterative denoising process. While recent caching-based methods effectively reuse redundant computations to speed up 2D and video generation, directly applying these techniques to 3D diffusion models can severely disrupt geometric consistency. In 3D synthesis, even minor numerical errors in cached latent features accumulate, causing structural artifacts and topological inconsistencies. To overcome this limitation, we propose Fast3Dcache, a training-free geometry-aware caching framework that accelerates 3D diffusion inference while preserving geometric fidelity. Our method introduces a Predictive Caching Scheduler Constraint (PCSC) to dynamically determine cache quotas according to voxel stabilization patterns and a Spatiotemporal Stability Criterion (SSC) to select stable features for reuse based on velocity magnitude and acceleration criterion. Comprehensive experiments show that Fast3Dcache accelerates inference significantly, achieving up to a 27.12% speed-up and a 54.8% reduction in FLOPs, with minimal degradation in geometric quality as measured by Chamfer Distance (2.48%) and F-Score (1.95%).
PDF11December 2, 2025