ChatPaper.aiChatPaper

Endlich besser als die Zufallsbaseline: Eine einfache und effektive Lösung für aktives Lernen in der 3D-biomedizinischen Bildgebung

Finally Outshining the Random Baseline: A Simple and Effective Solution for Active Learning in 3D Biomedical Imaging

January 20, 2026
papers.authors: Carsten T. Lüth, Jeremias Traub, Kim-Celine Kahl, Till J. Bungert, Lukas Klein, Lars Krämer, Paul F. Jäger, Klaus Maier-Hein, Fabian Isensee
cs.AI

papers.abstract

Aktives Lernen (AL) hat das Potenzial, die Annotationskosten bei der 3D-Biomedizin-Bildsegmentierung erheblich zu senken, da die Expertenmarkierung volumetrischer Daten sowohl zeitaufwändig als auch teuer ist. Bisherige AL-Methoden sind jedoch nicht in der Lage, verbesserte Zufallsstichproben-Baselines, die an 3D-Daten angepasst sind, konsistent zu übertreffen, was das Feld ohne zuverlässige Lösung lässt. Wir stellen Class-stratified Scheduled Power Predictive Entropy (ClaSP PE) vor, eine einfache und effektive Abfragestrategie, die zwei Hauptprobleme standardmäßiger unsicherheitsbasierter AL-Methoden adressiert: Klassenungleichgewicht und Redundanz in frühen Auswahlen. ClaSP PE kombiniert klassenstratifizierte Abfragen, um die Abdeckung unterrepräsentierter Strukturen zu gewährleisten, sowie Rauschen auf der Logarithmusskala mit einem abklingenden Zeitplan, um Abfragevielfalt in der frühen AL-Phase zu erzwingen und später Exploitation zu fördern. In unserer Auswertung von 24 experimentellen Settings mit vier 3D-Biomedizin-Datensätzen innerhalb des umfassenden nnActive-Benchmarks ist ClaSP PE die einzige Methode, die verbesserte Zufallsbaselines generell in Bezug auf Segmentierungsqualität mit statistisch signifikanten Gewinnen übertrifft und dabei annotations-effizient bleibt. Darüber hinaus simulieren wir die reale Anwendung explizit, indem wir unsere Methode an vier zuvor unbekannten Datensätzen testen, ohne manuelle Anpassung, wobei alle Experimentparameter gemäß vordefinierter Richtlinien gesetzt werden. Die Ergebnisse bestätigen, dass ClaSP PE robust auf neue Aufgaben generalisiert, ohne datasetspezifisches Tuning zu erfordern. Innerhalb des nnActive-Frameworks liefern wir überzeugende Belege dafür, dass eine AL-Methode in einem realistischen, produktionsnahen Szenario in Bezug auf Leistung und Annotationseffizienz konsistent an 3D-Segmentierung angepasste Zufallsbaselines übertreffen kann. Unsere quelloffene Implementierung und klaren Einsatzrichtlinien machen sie sofort praktisch anwendbar. Code ist verfügbar unter https://github.com/MIC-DKFZ/nnActive.
English
Active learning (AL) has the potential to drastically reduce annotation costs in 3D biomedical image segmentation, where expert labeling of volumetric data is both time-consuming and expensive. Yet, existing AL methods are unable to consistently outperform improved random sampling baselines adapted to 3D data, leaving the field without a reliable solution. We introduce Class-stratified Scheduled Power Predictive Entropy (ClaSP PE), a simple and effective query strategy that addresses two key limitations of standard uncertainty-based AL methods: class imbalance and redundancy in early selections. ClaSP PE combines class-stratified querying to ensure coverage of underrepresented structures and log-scale power noising with a decaying schedule to enforce query diversity in early-stage AL and encourage exploitation later. In our evaluation on 24 experimental settings using four 3D biomedical datasets within the comprehensive nnActive benchmark, ClaSP PE is the only method that generally outperforms improved random baselines in terms of both segmentation quality with statistically significant gains, whilst remaining annotation efficient. Furthermore, we explicitly simulate the real-world application by testing our method on four previously unseen datasets without manual adaptation, where all experiment parameters are set according to predefined guidelines. The results confirm that ClaSP PE robustly generalizes to novel tasks without requiring dataset-specific tuning. Within the nnActive framework, we present compelling evidence that an AL method can consistently outperform random baselines adapted to 3D segmentation, in terms of both performance and annotation efficiency in a realistic, close-to-production scenario. Our open-source implementation and clear deployment guidelines make it readily applicable in practice. Code is at https://github.com/MIC-DKFZ/nnActive.
PDF01January 22, 2026