VQ-Seg : Perturbation de tokens par quantification vectorielle pour la segmentation semi-supervisée d'images médicales
VQ-Seg: Vector-Quantized Token Perturbation for Semi-Supervised Medical Image Segmentation
January 15, 2026
papers.authors: Sicheng Yang, Zhaohu Xing, Lei Zhu
cs.AI
papers.abstract
L'apprentissage par cohérence avec perturbation des caractéristiques est une stratégie largement utilisée en segmentation semi-supervisée d'images médicales. Cependant, de nombreuses méthodes de perturbation existantes reposent sur du *dropout*, et nécessitent donc un réglage manuel minutieux du taux de *dropout*, qui est un hyperparamètre sensible souvent difficile à optimiser et pouvant conduire à une régularisation sous-optimale. Pour surmonter cette limite, nous proposons VQ-Seg, la première approche à utiliser la quantification vectorielle (VQ) pour discrétiser l'espace des caractéristiques et introduire un nouveau module de perturbation quantifiée (QPM) contrôlable qui remplace le *dropout*. Notre QPM perturbe les représentations discrètes en mélangeant les positions spatiales des indices du codebook, permettant une régularisation efficace et contrôlable. Pour atténuer la perte d'information potentielle causée par la quantification, nous concevons une architecture à double branche où l'espace de caractéristiques post-quantification est partagé entre les tâches de reconstruction d'image et de segmentation. De plus, nous introduisons un adaptateur de caractéristiques post-VQ (PFA) pour intégrer les guidages d'un modèle de fondation (FM), complétant ainsi l'information sémantique de haut niveau perdue durant la quantification. Par ailleurs, nous avons constitué un jeu de données à grande échelle sur le cancer du poumon (LC) comprenant 828 scanners TDM annotés pour le carcinome pulmonaire de type central. Des expériences approfondies sur le jeu de données LC et d'autres benchmarks publics démontrent l'efficacité de notre méthode, qui surpasse les approches de l'état de l'art. Le code est disponible à l'adresse : https://github.com/script-Yang/VQ-Seg.
English
Consistency learning with feature perturbation is a widely used strategy in semi-supervised medical image segmentation. However, many existing perturbation methods rely on dropout, and thus require a careful manual tuning of the dropout rate, which is a sensitive hyperparameter and often difficult to optimize and may lead to suboptimal regularization. To overcome this limitation, we propose VQ-Seg, the first approach to employ vector quantization (VQ) to discretize the feature space and introduce a novel and controllable Quantized Perturbation Module (QPM) that replaces dropout. Our QPM perturbs discrete representations by shuffling the spatial locations of codebook indices, enabling effective and controllable regularization. To mitigate potential information loss caused by quantization, we design a dual-branch architecture where the post-quantization feature space is shared by both image reconstruction and segmentation tasks. Moreover, we introduce a Post-VQ Feature Adapter (PFA) to incorporate guidance from a foundation model (FM), supplementing the high-level semantic information lost during quantization. Furthermore, we collect a large-scale Lung Cancer (LC) dataset comprising 828 CT scans annotated for central-type lung carcinoma. Extensive experiments on the LC dataset and other public benchmarks demonstrate the effectiveness of our method, which outperforms state-of-the-art approaches. Code available at: https://github.com/script-Yang/VQ-Seg.