ChatPaper.aiChatPaper

VQ-Seg: Perturbación de Tokens Cuantificados Vectorialmente para la Segmentación Semi-supervisada de Imágenes Médicas

VQ-Seg: Vector-Quantized Token Perturbation for Semi-Supervised Medical Image Segmentation

January 15, 2026
Autores: Sicheng Yang, Zhaohu Xing, Lei Zhu
cs.AI

Resumen

El aprendizaje de consistencia con perturbación de características es una estrategia ampliamente utilizada en la segmentación semi-supervisada de imágenes médicas. Sin embargo, muchos métodos de perturbación existentes se basan en dropout, lo que requiere un ajuste manual cuidadoso de la tasa de dropout, un hiperparámetro sensible y a menudo difícil de optimizar, pudiendo conducir a una regularización subóptima. Para superar esta limitación, proponemos VQ-Seg, el primer enfoque que emplea cuantización vectorial (VQ) para discretizar el espacio de características e introduce un novedoso y controlable Módulo de Perturbación Cuantizada (QPM) que reemplaza al dropout. Nuestro QPM perturba las representaciones discretas reorganizando las ubicaciones espaciales de los índices del libro de códigos, permitiendo una regularización efectiva y controlable. Para mitigar la posible pérdida de información causada por la cuantización, diseñamos una arquitectura de doble rama donde el espacio de características post-cuantización es compartido por las tareas de reconstrucción de imágenes y segmentación. Además, introducimos un Adaptador de Características Post-VQ (PFA) para incorporar la guía de un modelo fundacional (FM), supliendo la información semántica de alto nivel perdida durante la cuantización. Asimismo, recopilamos un conjunto de datos a gran escala de Cáncer de Pulmón (LC) que comprende 828 tomografías computarizadas anotadas para carcinoma pulmonar de tipo central. Experimentos exhaustivos en el conjunto de datos LC y otros benchmarks públicos demuestran la efectividad de nuestro método, el cual supera a los enfoques más avanzados. Código disponible en: https://github.com/script-Yang/VQ-Seg.
English
Consistency learning with feature perturbation is a widely used strategy in semi-supervised medical image segmentation. However, many existing perturbation methods rely on dropout, and thus require a careful manual tuning of the dropout rate, which is a sensitive hyperparameter and often difficult to optimize and may lead to suboptimal regularization. To overcome this limitation, we propose VQ-Seg, the first approach to employ vector quantization (VQ) to discretize the feature space and introduce a novel and controllable Quantized Perturbation Module (QPM) that replaces dropout. Our QPM perturbs discrete representations by shuffling the spatial locations of codebook indices, enabling effective and controllable regularization. To mitigate potential information loss caused by quantization, we design a dual-branch architecture where the post-quantization feature space is shared by both image reconstruction and segmentation tasks. Moreover, we introduce a Post-VQ Feature Adapter (PFA) to incorporate guidance from a foundation model (FM), supplementing the high-level semantic information lost during quantization. Furthermore, we collect a large-scale Lung Cancer (LC) dataset comprising 828 CT scans annotated for central-type lung carcinoma. Extensive experiments on the LC dataset and other public benchmarks demonstrate the effectiveness of our method, which outperforms state-of-the-art approaches. Code available at: https://github.com/script-Yang/VQ-Seg.
PDF11January 17, 2026