VQ-Seg: Perturbazione di Token con Vettori Quantizzati per la Segmentazione Semi-Supervisionata di Immagini Mediche

Abstract

L'apprendimento di consistenza con perturbazione delle caratteristiche è una strategia ampiamente utilizzata nella segmentazione semi-supervisionata di immagini mediche. Tuttavia, molti metodi di perturbazione esistenti si basano sul dropout, richiedendo quindi una regolazione manuale accurata del tasso di dropout, che è un iperparametro sensibile, spesso difficile da ottimizzare e che può portare a una regolarizzazione subottimale. Per superare questa limitazione, proponiamo VQ-Seg, il primo approccio che utilizza la quantizzazione vettoriale (VQ) per discretizzare lo spazio delle caratteristiche e introduce un nuovo e controllabile Modulo di Perturbazione Quantizzata (QPM) che sostituisce il dropout. Il nostro QPM perturba le rappresentazioni discrete rimescolando le posizioni spaziali degli indici del codebook, consentendo una regolarizzazione efficace e controllabile. Per mitigare la potenziale perdita di informazioni causata dalla quantizzazione, progettiamo un'architettura a doppio ramo in cui lo spazio delle caratteristiche post-quantizzazione è condiviso sia dal compito di ricostruzione dell'immagine che da quello di segmentazione. Inoltre, introduciamo un Adattatore delle Caratteristiche Post-VQ (PFA) per incorporare la guida di un modello base (FM), integrando così le informazioni semantiche di alto livello perse durante la quantizzazione. Ulteriormente, abbiamo raccolto un dataset su larga scala sul Cancro al Polmone (LC) comprendente 828 scansioni TC annotate per carcinoma polmonare di tipo centrale. Esperimenti estensivi sul dataset LC e su altri benchmark pubblici dimostrano l'efficacia del nostro metodo, che supera gli approcci all'avanguardia. Codice disponibile all'indirizzo: https://github.com/script-Yang/VQ-Seg.

English

Consistency learning with feature perturbation is a widely used strategy in semi-supervised medical image segmentation. However, many existing perturbation methods rely on dropout, and thus require a careful manual tuning of the dropout rate, which is a sensitive hyperparameter and often difficult to optimize and may lead to suboptimal regularization. To overcome this limitation, we propose VQ-Seg, the first approach to employ vector quantization (VQ) to discretize the feature space and introduce a novel and controllable Quantized Perturbation Module (QPM) that replaces dropout. Our QPM perturbs discrete representations by shuffling the spatial locations of codebook indices, enabling effective and controllable regularization. To mitigate potential information loss caused by quantization, we design a dual-branch architecture where the post-quantization feature space is shared by both image reconstruction and segmentation tasks. Moreover, we introduce a Post-VQ Feature Adapter (PFA) to incorporate guidance from a foundation model (FM), supplementing the high-level semantic information lost during quantization. Furthermore, we collect a large-scale Lung Cancer (LC) dataset comprising 828 CT scans annotated for central-type lung carcinoma. Extensive experiments on the LC dataset and other public benchmarks demonstrate the effectiveness of our method, which outperforms state-of-the-art approaches. Code available at: https://github.com/script-Yang/VQ-Seg.

VQ-Seg: Perturbazione di Token con Vettori Quantizzati per la Segmentazione Semi-Supervisionata di Immagini Mediche

VQ-Seg: Vector-Quantized Token Perturbation for Semi-Supervised Medical Image Segmentation

Abstract

Support