ChatPaper.aiChatPaper

Renderizado por Cuantiles: Incrustación Eficiente de Características de Alta Dimensionalidad en el Proyección Gaussiana 3D

Quantile Rendering: Efficiently Embedding High-dimensional Feature on 3D Gaussian Splatting

December 24, 2025
Autores: Yoonwoo Jeong, Cheng Sun, Frank Wang, Minsu Cho, Jaesung Choe
cs.AI

Resumen

Los recientes avances en visión por computadora han extendido con éxito la segmentación de vocabulario abierto (OVS) al dominio 3D mediante el uso de 3D Gaussian Splatting (3D-GS). A pesar de este progreso, la renderización eficiente de las características de alta dimensión requeridas para consultas de vocabulario abierto presenta un desafío significativo. Los métodos existentes emplean codebooks o compresión de características, lo que provoca pérdida de información y, en consecuencia, degrada la calidad de la segmentación. Para abordar esta limitación, presentamos Quantile Rendering (Q-Render), una novedosa estrategia de renderizado para Gaussianas 3D que maneja eficientemente características de alta dimensión manteniendo una alta fidelidad. A diferencia de la renderización volumétrica convencional, que muestrea densamente todas las Gaussianas 3D que intersectan cada rayo, Q-Render muestrea de forma dispersa únicamente aquellas con influencia dominante a lo largo del rayo. Al integrar Q-Render en una red neuronal 3D generalizable, también proponemos Gaussian Splatting Network (GS-Net), que predice las características Gaussianas de manera generalizable. Experimentos exhaustivos en ScanNet y LeRF demuestran que nuestro marco supera a los métodos state-of-the-art, permitiendo al mismo tiempo una renderización en tiempo real con una aceleración aproximada de ~43.7x en mapas de características de 512-D. El código estará disponible públicamente.
English
Recent advancements in computer vision have successfully extended Open-vocabulary segmentation (OVS) to the 3D domain by leveraging 3D Gaussian Splatting (3D-GS). Despite this progress, efficiently rendering the high-dimensional features required for open-vocabulary queries poses a significant challenge. Existing methods employ codebooks or feature compression, causing information loss, thereby degrading segmentation quality. To address this limitation, we introduce Quantile Rendering (Q-Render), a novel rendering strategy for 3D Gaussians that efficiently handles high-dimensional features while maintaining high fidelity. Unlike conventional volume rendering, which densely samples all 3D Gaussians intersecting each ray, Q-Render sparsely samples only those with dominant influence along the ray. By integrating Q-Render into a generalizable 3D neural network, we also propose Gaussian Splatting Network (GS-Net), which predicts Gaussian features in a generalizable manner. Extensive experiments on ScanNet and LeRF demonstrate that our framework outperforms state-of-the-art methods, while enabling real-time rendering with an approximate ~43.7x speedup on 512-D feature maps. Code will be made publicly available.
PDF51December 31, 2025