Enfin plus performant que la référence aléatoire : une solution simple et efficace pour l'apprentissage actif en imagerie biomédicale 3D
Finally Outshining the Random Baseline: A Simple and Effective Solution for Active Learning in 3D Biomedical Imaging
January 20, 2026
papers.authors: Carsten T. Lüth, Jeremias Traub, Kim-Celine Kahl, Till J. Bungert, Lukas Klein, Lars Krämer, Paul F. Jäger, Klaus Maier-Hein, Fabian Isensee
cs.AI
papers.abstract
L'apprentissage actif (AL) a le potentiel de réduire considérablement les coûts d'annotation dans la segmentation d'images biomédicales 3D, où l'étiquetage expert de données volumiques est à la fois chronophage et coûteux. Pourtant, les méthodes AL existantes sont incapables de surpasser de manière constante des bases de référence d'échantillonnage aléatoire améliorées et adaptées aux données 3D, laissant le domaine sans solution fiable. Nous présentons Class-stratified Scheduled Power Predictive Entropy (ClaSP PE), une stratégie de requête simple et efficace qui aborde deux limitations clés des méthodes AL standard basées sur l'incertitude : le déséquilibre des classes et la redondance dans les sélections précoces. ClaSP PE combine un interrogatoire stratifié par classe pour assurer la couverture des structures sous-représentées et un bruit de puissance à échelle logarithmique avec une planification décroissante pour imposer la diversité des requêtes dans les premières phases de l'AL et encourager l'exploitation plus tard. Dans notre évaluation sur 24 configurations expérimentales utilisant quatre jeux de données biomédicales 3D dans le cadre de référence complet nnActive, ClaSP PE est la seule méthode qui surpasse généralement les bases de référence aléatoires améliorées en termes de qualité de segmentation avec des gains statistiquement significatifs, tout en restant efficace en annotations. De plus, nous simulons explicitement l'application réelle en testant notre méthode sur quatre jeux de données jamais vus auparavant sans adaptation manuelle, où tous les paramètres expérimentaux sont définis selon des lignes directrices prédéfinies. Les résultats confirment que ClaSP PE se généralise robustement à de nouvelles tâches sans nécessiter de réglage spécifique au jeu de données. Dans le cadre nnActive, nous présentons des preuves convaincantes qu'une méthode AL peut constamment surpasser des bases de référence aléatoires adaptées à la segmentation 3D, en termes de performance et d'efficacité des annotations dans un scénario réaliste, proche de la production. Notre implémentation open-source et nos lignes directrices de déploiement claires la rendent immédiatement applicable en pratique. Le code est disponible à l'adresse https://github.com/MIC-DKFZ/nnActive.
English
Active learning (AL) has the potential to drastically reduce annotation costs in 3D biomedical image segmentation, where expert labeling of volumetric data is both time-consuming and expensive. Yet, existing AL methods are unable to consistently outperform improved random sampling baselines adapted to 3D data, leaving the field without a reliable solution. We introduce Class-stratified Scheduled Power Predictive Entropy (ClaSP PE), a simple and effective query strategy that addresses two key limitations of standard uncertainty-based AL methods: class imbalance and redundancy in early selections. ClaSP PE combines class-stratified querying to ensure coverage of underrepresented structures and log-scale power noising with a decaying schedule to enforce query diversity in early-stage AL and encourage exploitation later. In our evaluation on 24 experimental settings using four 3D biomedical datasets within the comprehensive nnActive benchmark, ClaSP PE is the only method that generally outperforms improved random baselines in terms of both segmentation quality with statistically significant gains, whilst remaining annotation efficient. Furthermore, we explicitly simulate the real-world application by testing our method on four previously unseen datasets without manual adaptation, where all experiment parameters are set according to predefined guidelines. The results confirm that ClaSP PE robustly generalizes to novel tasks without requiring dataset-specific tuning. Within the nnActive framework, we present compelling evidence that an AL method can consistently outperform random baselines adapted to 3D segmentation, in terms of both performance and annotation efficiency in a realistic, close-to-production scenario. Our open-source implementation and clear deployment guidelines make it readily applicable in practice. Code is at https://github.com/MIC-DKFZ/nnActive.