ChatPaper.aiChatPaper

잠재 확산 오토인코더: 의료 영상에서 효율적이고 의미 있는 비지도 표현 학습을 향하여

Latent Diffusion Autoencoders: Toward Efficient and Meaningful Unsupervised Representation Learning in Medical Imaging

April 11, 2025
저자: Gabriele Lozupone, Alessandro Bria, Francesco Fontanella, Frederick J. A. Meijer, Claudio De Stefano, Henkjan Huisman
cs.AI

초록

본 연구는 알츠하이머병(AD)을 중심으로 ADNI 데이터베이스의 뇌 MRI를 사례 연구로 활용하여, 의료 영상 분야에서 효율적이고 의미 있는 비지도 학습을 위한 새로운 인코더-디코더 확산 기반 프레임워크인 Latent Diffusion Autoencoder(LDAE)를 제안합니다. 기존의 이미지 공간에서 작동하는 확산 오토인코더와 달리, LDAE는 압축된 잠재 표현 공간에 확산 프로세스를 적용함으로써 계산 효율성을 개선하고 3D 의료 영상 표현 학습을 실현 가능하게 합니다. 제안된 접근법을 검증하기 위해, 우리는 두 가지 핵심 가설을 탐구합니다: (i) LDAE는 AD 및 노화와 관련된 3D 뇌 MRI의 의미 있는 의미론적 표현을 효과적으로 포착하며, (ii) LDAE는 계산적으로 효율적이면서도 고품질의 이미지 생성 및 재구성을 달성합니다. 실험 결과는 두 가설을 모두 지지합니다: (i) 선형 프로브 평가는 AD 진단(ROC-AUC: 90%, ACC: 84%) 및 연령 예측(MAE: 4.1년, RMSE: 5.2년)에서 유망한 성능을 보여줍니다; (ii) 학습된 의미론적 표현은 속성 조작을 가능하게 하여 해부학적으로 타당한 수정을 제공합니다; (iii) 의미론적 보간 실험은 6개월 간격의 누락된 스캔에 대해 SSIM 0.969(MSE: 0.0019)의 강력한 재구성 성능을 보여줍니다. 더 긴 간격(24개월)에서도 모델은 견고한 성능(SSIM > 0.93, MSE < 0.004)을 유지하며, 시간적 진행 추세를 포착하는 능력을 나타냅니다; (iv) 기존의 확산 오토인코더와 비교하여, LDAE는 추론 처리량을 크게 증가시키며(20배 빠름) 재구성 품질도 향상시킵니다. 이러한 결과는 LDAE를 확장 가능한 의료 영상 응용 분야에서 유망한 프레임워크로 자리매김하며, 의료 영상 분석을 위한 기초 모델로서의 잠재력을 보여줍니다. 코드는 https://github.com/GabrieleLozupone/LDAE에서 확인할 수 있습니다.
English
This study presents Latent Diffusion Autoencoder (LDAE), a novel encoder-decoder diffusion-based framework for efficient and meaningful unsupervised learning in medical imaging, focusing on Alzheimer disease (AD) using brain MR from the ADNI database as a case study. Unlike conventional diffusion autoencoders operating in image space, LDAE applies the diffusion process in a compressed latent representation, improving computational efficiency and making 3D medical imaging representation learning tractable. To validate the proposed approach, we explore two key hypotheses: (i) LDAE effectively captures meaningful semantic representations on 3D brain MR associated with AD and ageing, and (ii) LDAE achieves high-quality image generation and reconstruction while being computationally efficient. Experimental results support both hypotheses: (i) linear-probe evaluations demonstrate promising diagnostic performance for AD (ROC-AUC: 90%, ACC: 84%) and age prediction (MAE: 4.1 years, RMSE: 5.2 years); (ii) the learned semantic representations enable attribute manipulation, yielding anatomically plausible modifications; (iii) semantic interpolation experiments show strong reconstruction of missing scans, with SSIM of 0.969 (MSE: 0.0019) for a 6-month gap. Even for longer gaps (24 months), the model maintains robust performance (SSIM > 0.93, MSE < 0.004), indicating an ability to capture temporal progression trends; (iv) compared to conventional diffusion autoencoders, LDAE significantly increases inference throughput (20x faster) while also enhancing reconstruction quality. These findings position LDAE as a promising framework for scalable medical imaging applications, with the potential to serve as a foundation model for medical image analysis. Code available at https://github.com/GabrieleLozupone/LDAE

Summary

AI-Generated Summary

PDF52April 14, 2025