ChatPaper.aiChatPaper

TED-4DGS: Deformação Baseada em Ativação Temporal e Incorporação para Compressão de 4DGS

TED-4DGS: Temporally Activated and Embedding-based Deformation for 4DGS Compression

December 5, 2025
Autores: Cheng-Yuan Ho, He-Bi Yang, Jui-Chiu Chiang, Yu-Lun Liu, Wen-Hsiao Peng
cs.AI

Resumo

Com base no sucesso do 3D Gaussian Splatting (3DGS) na representação de cenas 3D estáticas, a sua extensão para cenas dinâmicas, geralmente designada por 4DGS ou 3DGS dinâmico, tem atraído uma atenção crescente. No entanto, a conceção de esquemas de deformação mais compactos e eficientes, juntamente com estratégias de compressão otimizadas para a taxa-de-distorção para representações de 3DGS dinâmico, permanece uma área pouco explorada. Os métodos anteriores baseiam-se quer em 4DGS espaço-temporal com primitivas Gaussianas de vida curta e sobrespecificadas, quer em 3DGS canónico com deformação que carece de controlo temporal explícito. Para resolver isto, apresentamos o TED-4DGS, um esquema de deformação baseado em incorporações e ativação temporal para compressão 4DGS otimizada para a taxa-de-distorção que unifica os pontos fortes de ambas as famílias. O TED-4DGS é construído sobre uma representação esparsa de 3DGS baseada em âncoras. A cada âncora canónica são atribuídos parâmetros de ativação temporal treináveis para especificar as suas transições de aparecimento e desaparecimento ao longo do tempo, enquanto uma incorporação temporal leve por âncora consulta um banco de deformação partilhado para produzir deformação específica da âncora. Para compressão de taxa-de-distorção, incorporamos um hiperprior baseado em representação neural implícita (INR) para modelar as distribuições de atributos das âncoras, juntamente com um modelo autoregressivo por canal para capturar correlações intra-âncora. Com estes novos elementos, o nosso esquema atinge um desempenho estado da arte em taxa-de-distorção em vários conjuntos de dados do mundo real. Tanto quanto sabemos, este trabalho representa uma das primeiras tentativas de perseguir uma estrutura de compressão otimizada para a taxa-de-distorção para representações de 3DGS dinâmico.
English
Building on the success of 3D Gaussian Splatting (3DGS) in static 3D scene representation, its extension to dynamic scenes, commonly referred to as 4DGS or dynamic 3DGS, has attracted increasing attention. However, designing more compact and efficient deformation schemes together with rate-distortion-optimized compression strategies for dynamic 3DGS representations remains an underexplored area. Prior methods either rely on space-time 4DGS with overspecified, short-lived Gaussian primitives or on canonical 3DGS with deformation that lacks explicit temporal control. To address this, we present TED-4DGS, a temporally activated and embedding-based deformation scheme for rate-distortion-optimized 4DGS compression that unifies the strengths of both families. TED-4DGS is built on a sparse anchor-based 3DGS representation. Each canonical anchor is assigned learnable temporal-activation parameters to specify its appearance and disappearance transitions over time, while a lightweight per-anchor temporal embedding queries a shared deformation bank to produce anchor-specific deformation. For rate-distortion compression, we incorporate an implicit neural representation (INR)-based hyperprior to model anchor attribute distributions, along with a channel-wise autoregressive model to capture intra-anchor correlations. With these novel elements, our scheme achieves state-of-the-art rate-distortion performance on several real-world datasets. To the best of our knowledge, this work represents one of the first attempts to pursue a rate-distortion-optimized compression framework for dynamic 3DGS representations.
PDF82March 20, 2026