ChatPaper.aiChatPaper

효율적인 X선 신시점 합성을 위한 방사형 가우시안 스플래팅

Radiative Gaussian Splatting for Efficient X-ray Novel View Synthesis

March 7, 2024
저자: Yuanhao Cai, Yixun Liang, Jiahao Wang, Angtian Wang, Yulun Zhang, Xiaokang Yang, Zongwei Zhou, Alan Yuille
cs.AI

초록

X선은 자연광보다 강한 투과력을 가지고 있어 투과 이미징에 널리 활용되고 있습니다. 새로운 시점의 X선 투영을 렌더링할 때, 기존의 NeRF 기반 방법들은 긴 학습 시간과 느린 추론 속도라는 문제를 안고 있습니다. 본 논문에서는 X선 새로운 시점 합성을 위한 3D 가우시안 스플래팅 기반 프레임워크인 X-Gaussian을 제안합니다. 첫째, X선 이미징의 등방성 특성에서 영감을 받아 방사형 가우시안 포인트 클라우드 모델을 재설계했습니다. 우리의 모델은 3D 점들의 방사 강도를 예측할 때 시점 방향의 영향을 배제합니다. 이 모델을 기반으로 CUDA 구현을 통해 미분 가능한 방사형 래스터화(DRR)를 개발했습니다. 둘째, X선 스캐너의 파라미터를 직접 사용하여 카메라 정보를 계산한 후, 스캔 대상 물체를 둘러싸는 직육면체 내에서 점 위치를 균일하게 샘플링하는 각도-포즈 직육면체 균일 초기화(ACUI) 전략을 맞춤 설계했습니다. 실험 결과, 우리의 X-Gaussian은 최신 방법들보다 6.5 dB 우수한 성능을 보이면서도 15% 미만의 학습 시간과 73배 이상의 추론 속도를 자랑합니다. 희소 뷰 CT 재구성에 대한 응용 또한 우리 방법의 실용적 가치를 보여줍니다. 코드와 모델은 https://github.com/caiyuanhao1998/X-Gaussian에서 공개될 예정이며, 학습 과정 시각화 비디오 데모는 https://www.youtube.com/watch?v=gDVf_Ngeghg에서 확인할 수 있습니다.
English
X-ray is widely applied for transmission imaging due to its stronger penetration than natural light. When rendering novel view X-ray projections, existing methods mainly based on NeRF suffer from long training time and slow inference speed. In this paper, we propose a 3D Gaussian splatting-based framework, namely X-Gaussian, for X-ray novel view synthesis. Firstly, we redesign a radiative Gaussian point cloud model inspired by the isotropic nature of X-ray imaging. Our model excludes the influence of view direction when learning to predict the radiation intensity of 3D points. Based on this model, we develop a Differentiable Radiative Rasterization (DRR) with CUDA implementation. Secondly, we customize an Angle-pose Cuboid Uniform Initialization (ACUI) strategy that directly uses the parameters of the X-ray scanner to compute the camera information and then uniformly samples point positions within a cuboid enclosing the scanned object. Experiments show that our X-Gaussian outperforms state-of-the-art methods by 6.5 dB while enjoying less than 15% training time and over 73x inference speed. The application on sparse-view CT reconstruction also reveals the practical values of our method. Code and models will be publicly available at https://github.com/caiyuanhao1998/X-Gaussian . A video demo of the training process visualization is at https://www.youtube.com/watch?v=gDVf_Ngeghg .
PDF71December 15, 2024