ChatPaper.aiChatPaper

Finalmente Superando la Línea Base Aleatoria: Una Solución Sencilla y Efectiva para el Aprendizaje Activo en Imágenes Biomédicas 3D

Finally Outshining the Random Baseline: A Simple and Effective Solution for Active Learning in 3D Biomedical Imaging

January 20, 2026
Autores: Carsten T. Lüth, Jeremias Traub, Kim-Celine Kahl, Till J. Bungert, Lukas Klein, Lars Krämer, Paul F. Jäger, Klaus Maier-Hein, Fabian Isensee
cs.AI

Resumen

El aprendizaje activo (AL) tiene el potencial de reducir drásticamente los costes de anotación en la segmentación de imágenes biomédicas 3D, donde el etiquetado experto de datos volumétricos es a la vez lento y costoso. Sin embargo, los métodos de AL existentes no logran superar de forma consistente a los baselines mejorados de muestreo aleatorio adaptados a datos 3D, dejando al campo sin una solución fiable. Presentamos Class-stratified Scheduled Power Predictive Entropy (ClaSP PE), una estrategia de consulta simple y efectiva que aborda dos limitaciones clave de los métodos estándar de AL basados en incertidumbre: el desequilibrio de clases y la redundancia en las selecciones iniciales. ClaSP PE combina una consulta estratificada por clases para garantizar la cobertura de estructuras infrarrepresentadas y la aplicación de ruido de potencia en escala logarítmica con un programa de decaimiento para imponer diversidad en las consultas durante las etapas iniciales del AL y fomentar la explotación posterior. En nuestra evaluación en 24 escenarios experimentales utilizando cuatro conjuntos de datos biomédicos 3D dentro del benchmark integral nnActive, ClaSP PE es el único método que generalmente supera a los baselines aleatorios mejorados en términos de calidad de segmentación con ganancias estadísticamente significativas, manteniéndose además eficiente en anotaciones. Además, simulamos explícitamente la aplicación en el mundo real probando nuestro método en cuatro conjuntos de datos nunca vistos sin adaptación manual, donde todos los parámetros del experimento se establecen según directrices predefinidas. Los resultados confirman que ClaSP PE se generaliza robustamente a nuevas tareas sin requerir ajustes específicos por conjunto de datos. Dentro del marco nnActive, presentamos evidencia convincente de que un método de AL puede superar consistentemente a los baselines aleatorios adaptados a la segmentación 3D, tanto en rendimiento como en eficiencia de anotación, en un escenario realista y cercano a la producción. Nuestra implementación de código abierto y nuestras directrices de despliegue claras lo hacen fácilmente aplicable en la práctica. El código está disponible en https://github.com/MIC-DKFZ/nnActive.
English
Active learning (AL) has the potential to drastically reduce annotation costs in 3D biomedical image segmentation, where expert labeling of volumetric data is both time-consuming and expensive. Yet, existing AL methods are unable to consistently outperform improved random sampling baselines adapted to 3D data, leaving the field without a reliable solution. We introduce Class-stratified Scheduled Power Predictive Entropy (ClaSP PE), a simple and effective query strategy that addresses two key limitations of standard uncertainty-based AL methods: class imbalance and redundancy in early selections. ClaSP PE combines class-stratified querying to ensure coverage of underrepresented structures and log-scale power noising with a decaying schedule to enforce query diversity in early-stage AL and encourage exploitation later. In our evaluation on 24 experimental settings using four 3D biomedical datasets within the comprehensive nnActive benchmark, ClaSP PE is the only method that generally outperforms improved random baselines in terms of both segmentation quality with statistically significant gains, whilst remaining annotation efficient. Furthermore, we explicitly simulate the real-world application by testing our method on four previously unseen datasets without manual adaptation, where all experiment parameters are set according to predefined guidelines. The results confirm that ClaSP PE robustly generalizes to novel tasks without requiring dataset-specific tuning. Within the nnActive framework, we present compelling evidence that an AL method can consistently outperform random baselines adapted to 3D segmentation, in terms of both performance and annotation efficiency in a realistic, close-to-production scenario. Our open-source implementation and clear deployment guidelines make it readily applicable in practice. Code is at https://github.com/MIC-DKFZ/nnActive.
PDF01January 22, 2026