CheXmask-U: X-ray 영상에서 랜드마크 기반 해부학적 분할의 불확실성 정량화
CheXmask-U: Quantifying uncertainty in landmark-based anatomical segmentation for X-ray images
December 11, 2025
저자: Matias Cosarinsky, Nicolas Gaggion, Rodrigo Echeveste, Enzo Ferrante
cs.AI
초록
불확실성 추정은 의료 영상 분할 시스템의 안전한 임상 적용에 필수적이며, 신뢰할 수 없는 예측을 식별하고 인간의 감독을 지원합니다. 기존 연구는 주로 픽셀 수준의 불확실성에 집중해 왔으나, 랜드마크 기반 분할은 본질적인 위상학적 보장을 제공함에도 불구하고 불확실성 관점에서는 여전히 충분히 탐구되지 않았습니다. 본 연구에서는 흉부 X-선에서 해부학적 랜드마크 기반 분할에 대한 불확실성 추정을 연구합니다. 표준 영상 컨볼루션 인코더와 그래프 기반 생성 디코더를 결합한 하이브리드 신경망 구조와 그 변분 잠재 공간을 활용하여 두 가지 상호 보완적인 측정치를 도출합니다: (i) 학습된 분포 매개변수에서 직접 포착되는 잠재적 불확실성과 (ii) 잠재 표본에서 여러 확률적 출력 예측을 생성하여 얻는 예측 불확실성. 통제된 손상 실험을 통해 두 불확실성 측정치가 교란 심각도에 따라 증가하며, 전역적 및 지역적 저하를 모두 반영함을 보여줍니다. 이러한 불확실성 신호가 수동 기준값과 비교하여 신뢰할 수 없는 예측을 식별할 수 있음을 입증하고, CheXmask 데이터셋에서 분포 외 탐지를 지원함을 보입니다. 더 중요하게는, 우리는 657,566개의 흉부 X-선 랜드마크 분할과 노드별 불확실성 추정치를 포함한 대규모 데이터셋인 CheXmask-U(huggingface.co/datasets/mcosarinsky/CheXmask-U)를 공개하여, 연구자들이 이러한 해부학적 마스크를 사용할 때 분할 품질의 공간적 변동을 고려할 수 있도록 합니다. 우리의 연구 결과는 흉부 X-선에서 랜드마크 기반 해부학적 분할 방법의 견고성과 안전한 배치를 향상시키는 유망한 방향으로 불확실성 추정을 정립합니다. 본 방법의 완전히 작동하는 대화형 데모는 huggingface.co/spaces/matiasky/CheXmask-U에서, 소스 코드는 github.com/mcosarinsky/CheXmask-U에서 이용할 수 있습니다.
English
Uncertainty estimation is essential for the safe clinical deployment of medical image segmentation systems, enabling the identification of unreliable predictions and supporting human oversight. While prior work has largely focused on pixel-level uncertainty, landmark-based segmentation offers inherent topological guarantees yet remains underexplored from an uncertainty perspective. In this work, we study uncertainty estimation for anatomical landmark-based segmentation on chest X-rays. Inspired by hybrid neural network architectures that combine standard image convolutional encoders with graph-based generative decoders, and leveraging their variational latent space, we derive two complementary measures: (i) latent uncertainty, captured directly from the learned distribution parameters, and (ii) predictive uncertainty, obtained by generating multiple stochastic output predictions from latent samples. Through controlled corruption experiments we show that both uncertainty measures increase with perturbation severity, reflecting both global and local degradation. We demonstrate that these uncertainty signals can identify unreliable predictions by comparing with manual ground-truth, and support out-of-distribution detection on the CheXmask dataset. More importantly, we release CheXmask-U (huggingface.co/datasets/mcosarinsky/CheXmask-U), a large scale dataset of 657,566 chest X-ray landmark segmentations with per-node uncertainty estimates, enabling researchers to account for spatial variations in segmentation quality when using these anatomical masks. Our findings establish uncertainty estimation as a promising direction to enhance robustness and safe deployment of landmark-based anatomical segmentation methods in chest X-ray. A fully working interactive demo of the method is available at huggingface.co/spaces/matiasky/CheXmask-U and the source code at github.com/mcosarinsky/CheXmask-U.