ChatPaper.aiChatPaper

VQ-Seg: 반지도 의료 영상 분할을 위한 벡터 양자화 토큰 교란 기법

VQ-Seg: Vector-Quantized Token Perturbation for Semi-Supervised Medical Image Segmentation

January 15, 2026
저자: Sicheng Yang, Zhaohu Xing, Lei Zhu
cs.AI

초록

특징 변형을 활용한 일관성 학습은 준지도 의료 영상 분할에서 널리 사용되는 전략입니다. 그러나 기존의 많은 변형 방법은 드롭아웃에 의존하며, 민감한 하이퍼파라미터인 드롭아웃 비율을 신중하게 수동으로 조정해야 합니다. 이는 최적화하기 어렵고 종종 차선의 정규화 결과를 초래할 수 있습니다. 이러한 한계를 극복하기 위해 본 연구에서는 특징 공간을 이산화하기 위해 벡터 양자화(VQ)를 최초로 활용하고, 드롭아웃을 대체하는 새롭고 제어 가능한 양자화 변형 모듈(QPM)을 도입한 VQ-Seg를 제안합니다. 우리의 QPM은 코드북 인덱스의 공간적 위치를 섞어 이산적 표현을 변형함으로써 효과적이고 제어 가능한 정규화를 가능하게 합니다. 양자화로 인한 잠재적 정보 손실을 완화하기 위해, 양자화 후 특징 공간을 영상 재구성 및 분할 작업이 공유하는 이중 분기 아키텍처를 설계했습니다. 더 나아가 양자화 과정에서 손실될 수 있는 고수준 의미 정보를 보완하기 위해 파운데이션 모델(FM)의 지도를 통합하는 사후-VQ 특징 적응기(PFA)를 도입했습니다. 또한, 중앙형 폐암에 대해 주석이 달린 828개의 CT 스캔으로 구성된 대규모 폐암(LC) 데이터셋을 구축했습니다. LC 데이터셋과 다른 공개 벤치마크에서의 광범위한 실험을 통해 우리 방법의 효과성을 입증하였으며, 이는 최첨단 접근법들을 능가하는 성능을 보여줍니다. 코드는 https://github.com/script-Yang/VQ-Seg에서 확인할 수 있습니다.
English
Consistency learning with feature perturbation is a widely used strategy in semi-supervised medical image segmentation. However, many existing perturbation methods rely on dropout, and thus require a careful manual tuning of the dropout rate, which is a sensitive hyperparameter and often difficult to optimize and may lead to suboptimal regularization. To overcome this limitation, we propose VQ-Seg, the first approach to employ vector quantization (VQ) to discretize the feature space and introduce a novel and controllable Quantized Perturbation Module (QPM) that replaces dropout. Our QPM perturbs discrete representations by shuffling the spatial locations of codebook indices, enabling effective and controllable regularization. To mitigate potential information loss caused by quantization, we design a dual-branch architecture where the post-quantization feature space is shared by both image reconstruction and segmentation tasks. Moreover, we introduce a Post-VQ Feature Adapter (PFA) to incorporate guidance from a foundation model (FM), supplementing the high-level semantic information lost during quantization. Furthermore, we collect a large-scale Lung Cancer (LC) dataset comprising 828 CT scans annotated for central-type lung carcinoma. Extensive experiments on the LC dataset and other public benchmarks demonstrate the effectiveness of our method, which outperforms state-of-the-art approaches. Code available at: https://github.com/script-Yang/VQ-Seg.
PDF11January 17, 2026