ChatPaper.aiChatPaper

Наконец-то превзойдя случайный базовый уровень: простое и эффективное решение для активного обучения в 3D биомедицинской визуализации

Finally Outshining the Random Baseline: A Simple and Effective Solution for Active Learning in 3D Biomedical Imaging

January 20, 2026
Авторы: Carsten T. Lüth, Jeremias Traub, Kim-Celine Kahl, Till J. Bungert, Lukas Klein, Lars Krämer, Paul F. Jäger, Klaus Maier-Hein, Fabian Isensee
cs.AI

Аннотация

Активное обучение (АО) обладает потенциалом для значительного снижения затрат на разметку при сегментации 3D биомедицинских изображений, где экспертная аннотация объемных данных является как трудоемкой, так и дорогостоящей. Однако существующие методы АО не способны стабильно превосходить улучшенные базовые методы случайной выборки, адаптированные для 3D данных, что оставляет область без надежного решения. Мы представляем Class-stratified Scheduled Power Predictive Entropy (ClaSP PE) — простую и эффективную стратегию запросов, которая устраняет два ключевых ограничения стандартных методов АО, основанных на неопределенности: дисбаланс классов и избыточность на ранних этапах отбора. ClaSP PE объединяет стратифицированный по классам запрос для обеспечения покрытия слабо представленных структур и добавление шума к логарифмической степени с затухающим расписанием для обеспечения разнообразия запросов на ранней стадии АО и поощрения эксплуатации на поздних этапах. В нашей оценке в 24 экспериментальных условиях с использованием четырех наборов 3D биомедицинских данных в рамках комплексного бенчмарка nnActive, ClaSP PE является единственным методом, который стабильно превосходит улучшенные случайные базовые методы как по качеству сегментации со статистически значимым улучшением, так и по эффективности аннотирования. Кроме того, мы явно моделируем реальное применение, тестируя наш метод на четырех ранее не встречавшихся наборах данных без ручной адаптации, где все параметры эксперимента устанавливаются в соответствии с предопределенными руководствами. Результаты подтверждают, что ClaSP PE надежно обобщается на новые задачи без необходимости настройки под конкретный набор данных. В рамках инфраструктуры nnActive мы представляем убедительные доказательства того, что метод АО может стабильно превосходить адаптированные для 3D сегментации случайные базовые методы как по производительности, так и по эффективности аннотирования в реалистичном, близком к производственному сценарии. Наша открытая реализация и четкие руководства по развертыванию делают метод легко применимым на практике. Код доступен по адресу https://github.com/MIC-DKFZ/nnActive.
English
Active learning (AL) has the potential to drastically reduce annotation costs in 3D biomedical image segmentation, where expert labeling of volumetric data is both time-consuming and expensive. Yet, existing AL methods are unable to consistently outperform improved random sampling baselines adapted to 3D data, leaving the field without a reliable solution. We introduce Class-stratified Scheduled Power Predictive Entropy (ClaSP PE), a simple and effective query strategy that addresses two key limitations of standard uncertainty-based AL methods: class imbalance and redundancy in early selections. ClaSP PE combines class-stratified querying to ensure coverage of underrepresented structures and log-scale power noising with a decaying schedule to enforce query diversity in early-stage AL and encourage exploitation later. In our evaluation on 24 experimental settings using four 3D biomedical datasets within the comprehensive nnActive benchmark, ClaSP PE is the only method that generally outperforms improved random baselines in terms of both segmentation quality with statistically significant gains, whilst remaining annotation efficient. Furthermore, we explicitly simulate the real-world application by testing our method on four previously unseen datasets without manual adaptation, where all experiment parameters are set according to predefined guidelines. The results confirm that ClaSP PE robustly generalizes to novel tasks without requiring dataset-specific tuning. Within the nnActive framework, we present compelling evidence that an AL method can consistently outperform random baselines adapted to 3D segmentation, in terms of both performance and annotation efficiency in a realistic, close-to-production scenario. Our open-source implementation and clear deployment guidelines make it readily applicable in practice. Code is at https://github.com/MIC-DKFZ/nnActive.
PDF01January 22, 2026