ChatPaper.aiChatPaper

ついにランダムベースラインを凌駕:3Dバイオメディカルイメージングにおける能動学習のためのシンプルかつ効果的なソリューション

Finally Outshining the Random Baseline: A Simple and Effective Solution for Active Learning in 3D Biomedical Imaging

January 20, 2026
著者: Carsten T. Lüth, Jeremias Traub, Kim-Celine Kahl, Till J. Bungert, Lukas Klein, Lars Krämer, Paul F. Jäger, Klaus Maier-Hein, Fabian Isensee
cs.AI

要旨

能動学習(AL)は、3D生体医用画像セグメンテーションにおけるアノテーションコストを大幅に削減する可能性を秘めている。ボリュームデータの専門家によるラベリングは時間とコストを要するためである。しかし、既存のAL手法は、3Dデータに適応させた改良版ランダムサンプリングベースラインを一貫して上回ることができず、信頼性の高い解決策が欠如している状況にある。本研究では、標準的な不確実性ベースのAL手法の二つの主要な限界であるクラス不均衡と初期選択における冗長性に着目した、シンプルかつ効果的なクエリ戦略「Class-stratified Scheduled Power Predictive Entropy (ClaSP PE)」を提案する。ClaSP PEは、低頻度構造の網羅性を確保するクラス階層化クエリと、対数スケールのべき乗ノイズ付加と減衰スケジュールを組み合わせることで、AL初期段階ではクエリの多様性を強制し、後期段階では活用を促進する。包括的nnActiveベンチマーク内の4つの3D生体医用データセットを用いた24の実験設定による評価において、ClaSP PEは、統計的有意差を持つセグメンテーション品質の向上において、改良版ランダムベースラインを一般的に上回った唯一の手法であり、同時にアノテーション効率も維持した。さらに、手動での適応なしに4つの未見データセットで提案手法をテストすることで、現実世界の応用を明示的にシミュレートした。全ての実験パラメータは事前に定義されたガイドラインに従って設定された。結果は、ClaSP PEがデータセット固有の調整を必要とせず、新しいタスクに対して頑健に一般化することを確認した。nnActiveフレームワーク内で、我々は、現実的かつ実運用に近いシナリオにおいて、性能とアノテーション効率の両面で、3Dセグメンテーションに適応したランダムベースラインをAL手法が一貫して上回り得るという説得力のある証拠を提示する。オープンソース実装と明確な導入ガイドラインにより、本手法は実践的に即座に適用可能である。コードはhttps://github.com/MIC-DKFZ/nnActiveにある。
English
Active learning (AL) has the potential to drastically reduce annotation costs in 3D biomedical image segmentation, where expert labeling of volumetric data is both time-consuming and expensive. Yet, existing AL methods are unable to consistently outperform improved random sampling baselines adapted to 3D data, leaving the field without a reliable solution. We introduce Class-stratified Scheduled Power Predictive Entropy (ClaSP PE), a simple and effective query strategy that addresses two key limitations of standard uncertainty-based AL methods: class imbalance and redundancy in early selections. ClaSP PE combines class-stratified querying to ensure coverage of underrepresented structures and log-scale power noising with a decaying schedule to enforce query diversity in early-stage AL and encourage exploitation later. In our evaluation on 24 experimental settings using four 3D biomedical datasets within the comprehensive nnActive benchmark, ClaSP PE is the only method that generally outperforms improved random baselines in terms of both segmentation quality with statistically significant gains, whilst remaining annotation efficient. Furthermore, we explicitly simulate the real-world application by testing our method on four previously unseen datasets without manual adaptation, where all experiment parameters are set according to predefined guidelines. The results confirm that ClaSP PE robustly generalizes to novel tasks without requiring dataset-specific tuning. Within the nnActive framework, we present compelling evidence that an AL method can consistently outperform random baselines adapted to 3D segmentation, in terms of both performance and annotation efficiency in a realistic, close-to-production scenario. Our open-source implementation and clear deployment guidelines make it readily applicable in practice. Code is at https://github.com/MIC-DKFZ/nnActive.
PDF01January 22, 2026