ChatPaper.aiChatPaper

마침내 무작위 기준선을 능가하다: 3D 생체의학 영상에서의 능동 학습을 위한 간단하고 효과적인 해법

Finally Outshining the Random Baseline: A Simple and Effective Solution for Active Learning in 3D Biomedical Imaging

January 20, 2026
저자: Carsten T. Lüth, Jeremias Traub, Kim-Celine Kahl, Till J. Bungert, Lukas Klein, Lars Krämer, Paul F. Jäger, Klaus Maier-Hein, Fabian Isensee
cs.AI

초록

액티브 러닝(AL)은 볼류메트릭 데이터에 대한 전문가 수준 라벨링이 시간과 비용이 많이 드는 3D 생체의학 이미지 분할에서 주석 비용을 획기적으로 절감할 잠재력을 지닙니다. 그러나 기존 AL 방법들은 3D 데이터에 맞게 개선된 무작위 샘플링 기준선을 지속적으로 능가하지 못해 이 분야에 신뢰할 수 있는 해결책이 부재한 실정입니다. 본 연구에서는 표준 불확실성 기반 AL 방법의 두 가지 주요 한계인 클래스 불균형과 초기 선택의 중복성을 해결하는 간단하면서 효과적인 질의 전략인 클래스 계층화 예정 전력 예측 엔트로피(ClaSP PE)를 소개합니다. ClaSP PE는 저조하게 표현된 구조의 Coverage를 보장하기 위한 클래스 계층화 질의와, 초기 AL 단계에서 질의 다양성을 강화하고 후기 단계에서 exploitation을 촉진하기 위한 감쇠 스케줄을 적용한 로그 스케일 전력 노이징을 결합합니다. 포괄적인 nnActive 벤치마크 내 네 가지 3D 생체의학 데이터셋을 활용한 24개 실험 설정에 대한 평가에서 ClaSP PE는 통계적으로 유의미한 성능 향상과 함께 분할 품질 측면에서 개선된 무작위 기준선을 일반적으로 능가하는 유일한 방법이었으며, 동시에 주석 효율성도 유지했습니다. 더 나아가, 모든 실험 매개변수가 사전 정의된 지침에 따라 설정된 상태에서 수동 조정 없이 이전에 확인되지 않은 네 가지 데이터셋에 대해 본 방법을 테스트함으로써 실제 적용 환경을 명시적으로 시뮬레이션했습니다. 결과는 ClaSP PE가 데이터셋별 조정 없이도 새로운 작업에 강건하게 일반화됨을 확인시켜 줍니다. nnActive 프레임워크 내에서 우리는 AL 방법이 현실적이고 프로덕션 환경에 가까운 시나리오에서 성능과 주석 효율성 모두 측면에서 3D 분할에 적응된 무작위 기준선을 지속적으로 능가할 수 있음을 설득력 있게 입증합니다. 우리의 오픈소스 구현체와 명확한 배포 지침은 실제 적용을 용이하게 합니다. 코드는 https://github.com/MIC-DKFZ/nnActive에서 확인할 수 있습니다.
English
Active learning (AL) has the potential to drastically reduce annotation costs in 3D biomedical image segmentation, where expert labeling of volumetric data is both time-consuming and expensive. Yet, existing AL methods are unable to consistently outperform improved random sampling baselines adapted to 3D data, leaving the field without a reliable solution. We introduce Class-stratified Scheduled Power Predictive Entropy (ClaSP PE), a simple and effective query strategy that addresses two key limitations of standard uncertainty-based AL methods: class imbalance and redundancy in early selections. ClaSP PE combines class-stratified querying to ensure coverage of underrepresented structures and log-scale power noising with a decaying schedule to enforce query diversity in early-stage AL and encourage exploitation later. In our evaluation on 24 experimental settings using four 3D biomedical datasets within the comprehensive nnActive benchmark, ClaSP PE is the only method that generally outperforms improved random baselines in terms of both segmentation quality with statistically significant gains, whilst remaining annotation efficient. Furthermore, we explicitly simulate the real-world application by testing our method on four previously unseen datasets without manual adaptation, where all experiment parameters are set according to predefined guidelines. The results confirm that ClaSP PE robustly generalizes to novel tasks without requiring dataset-specific tuning. Within the nnActive framework, we present compelling evidence that an AL method can consistently outperform random baselines adapted to 3D segmentation, in terms of both performance and annotation efficiency in a realistic, close-to-production scenario. Our open-source implementation and clear deployment guidelines make it readily applicable in practice. Code is at https://github.com/MIC-DKFZ/nnActive.
PDF01January 22, 2026