Eindelijk beter dan de willekeurige basislijn: een eenvoudige en effectieve oplossing voor actief leren in 3D-biomedische beeldvorming
Finally Outshining the Random Baseline: A Simple and Effective Solution for Active Learning in 3D Biomedical Imaging
January 20, 2026
Auteurs: Carsten T. Lüth, Jeremias Traub, Kim-Celine Kahl, Till J. Bungert, Lukas Klein, Lars Krämer, Paul F. Jäger, Klaus Maier-Hein, Fabian Isensee
cs.AI
Samenvatting
Actief leren (AL) heeft het potentieel om de annotatiekosten voor 3D-biomedische beeldsegmentatie aanzienlijk te verlagen, aangezien het labelen van volumetrische data door experts tijdrovend en duur is. Toch slagen bestaande AL-methoden er niet in om consistent beter te presteren dan verbeterde, op 3D-data aangepaste, steekproefsgewijze basislijnen, waardoor het veld zonder een betrouwbare oplossing blijft zitten. Wij introduceren Class-stratified Scheduled Power Predictive Entropy (ClaSP PE), een eenvoudige en effectieve querystrategie die twee belangrijke beperkingen van standaard op onzekerheid gebaseerde AL-methoden aanpakt: klasse-onbalans en redundantie in vroege selecties. ClaSP PE combineert klasse-gestratificeerd bevragen om dekking van ondervertegenwoordigde structuren te garanderen, en logaritmische power-noising met een afnemend schema om querydiversiteit in de vroege AL-fase af te dwingen en exploitatie later aan te moedigen. In onze evaluatie in 24 experimentele settingen met vier 3D-biomedische datasets binnen de uitgebreide nnActive-benchmark, is ClaSP PE de enige methode die over het algemeen beter presteert dan de verbeterde steekproefsgewijze basislijnen, zowel in termen van segmentatiekwaliteit met statistisch significante winst, als qua annotatie-efficiëntie. Verder simuleren we de praktijktoepassing expliciet door onze methode te testen op vier niet eerder gezien datasets zonder handmatige aanpassing, waarbij alle experimentparameters worden ingesteld volgens vooraf gedefinieerde richtlijnen. De resultaten bevestigen dat ClaSP PE robuust generaliseert naar nieuwe taken zonder datasetspecifieke afstemming. Binnen het nnActive-framework presenteren we overtuigend bewijs dat een AL-methode consistent beter kan presteren dan op 3D-segmentatie aangepaste steekproefsgewijze basislijnen, zowel qua prestaties als annotatie-efficiëntie in een realistische, productie-achtijke scenario. Onze open-source-implementatie en duidelijke implementatierichtlijnen maken het direct toepasbaar in de praktijk. Code is beschikbaar op https://github.com/MIC-DKFZ/nnActive.
English
Active learning (AL) has the potential to drastically reduce annotation costs in 3D biomedical image segmentation, where expert labeling of volumetric data is both time-consuming and expensive. Yet, existing AL methods are unable to consistently outperform improved random sampling baselines adapted to 3D data, leaving the field without a reliable solution. We introduce Class-stratified Scheduled Power Predictive Entropy (ClaSP PE), a simple and effective query strategy that addresses two key limitations of standard uncertainty-based AL methods: class imbalance and redundancy in early selections. ClaSP PE combines class-stratified querying to ensure coverage of underrepresented structures and log-scale power noising with a decaying schedule to enforce query diversity in early-stage AL and encourage exploitation later. In our evaluation on 24 experimental settings using four 3D biomedical datasets within the comprehensive nnActive benchmark, ClaSP PE is the only method that generally outperforms improved random baselines in terms of both segmentation quality with statistically significant gains, whilst remaining annotation efficient. Furthermore, we explicitly simulate the real-world application by testing our method on four previously unseen datasets without manual adaptation, where all experiment parameters are set according to predefined guidelines. The results confirm that ClaSP PE robustly generalizes to novel tasks without requiring dataset-specific tuning. Within the nnActive framework, we present compelling evidence that an AL method can consistently outperform random baselines adapted to 3D segmentation, in terms of both performance and annotation efficiency in a realistic, close-to-production scenario. Our open-source implementation and clear deployment guidelines make it readily applicable in practice. Code is at https://github.com/MIC-DKFZ/nnActive.