ChatPaper.aiChatPaper

Finalmente Superando a Linha de Base Aleatória: Uma Solução Simples e Eficaz para Aprendizado Ativo em Imagens Biomédicas 3D

Finally Outshining the Random Baseline: A Simple and Effective Solution for Active Learning in 3D Biomedical Imaging

January 20, 2026
Autores: Carsten T. Lüth, Jeremias Traub, Kim-Celine Kahl, Till J. Bungert, Lukas Klein, Lars Krämer, Paul F. Jäger, Klaus Maier-Hein, Fabian Isensee
cs.AI

Resumo

A aprendizagem ativa (AL) tem o potencial de reduzir drasticamente os custos de anotação na segmentação de imagens biomédicas 3D, onde a rotulagem especializada de dados volumétricos é demorada e dispendiosa. No entanto, os métodos de AL existentes não conseguem superar consistentemente as linhas de base de amostragem aleatória melhoradas adaptadas a dados 3D, deixando a área sem uma solução confiável. Apresentamos a Entropia Preditiva de Potência Agendada com Estratificação de Classe (ClaSP PE), uma estratégia de consulta simples e eficaz que aborda duas limitações principais dos métodos padrão de AL baseados em incerteza: o desequilíbrio de classes e a redundância nas seleções iniciais. A ClaSP PE combina consultas com estratificação de classe para garantir a cobertura de estruturas sub-representadas e a adição de ruído de potência em escala logarítmica com um cronograma decrescente para impor a diversidade de consultas na fase inicial da AL e incentivar a exploração posterior. Na nossa avaliação em 24 configurações experimentais usando quatro conjuntos de dados biomédicos 3D dentro do abrangente benchmark nnActive, a ClaSP PE é o único método que geralmente supera as linhas de base aleatórias melhoradas em termos de qualidade de segmentação com ganhos estatisticamente significativos, mantendo-se eficiente em anotações. Além disso, simulamos explicitamente a aplicação do mundo real testando o nosso método em quatro conjuntos de dados nunca antes vistos sem adaptação manual, onde todos os parâmetros experimentais são definidos de acordo com diretrizes pré-estabelecidas. Os resultados confirmam que a ClaSP PE generaliza robustamente para novas tarefas sem exigir ajustes específicos do conjunto de dados. Dentro da estrutura nnActive, apresentamos evidências convincentes de que um método de AL pode superar consistentemente as linhas de base aleatórias adaptadas à segmentação 3D, tanto em desempenho quanto em eficiência de anotação num cenário realista e próximo da produção. A nossa implementação de código aberto e diretrizes de implantação claras tornam-na prontamente aplicável na prática. O código está disponível em https://github.com/MIC-DKFZ/nnActive.
English
Active learning (AL) has the potential to drastically reduce annotation costs in 3D biomedical image segmentation, where expert labeling of volumetric data is both time-consuming and expensive. Yet, existing AL methods are unable to consistently outperform improved random sampling baselines adapted to 3D data, leaving the field without a reliable solution. We introduce Class-stratified Scheduled Power Predictive Entropy (ClaSP PE), a simple and effective query strategy that addresses two key limitations of standard uncertainty-based AL methods: class imbalance and redundancy in early selections. ClaSP PE combines class-stratified querying to ensure coverage of underrepresented structures and log-scale power noising with a decaying schedule to enforce query diversity in early-stage AL and encourage exploitation later. In our evaluation on 24 experimental settings using four 3D biomedical datasets within the comprehensive nnActive benchmark, ClaSP PE is the only method that generally outperforms improved random baselines in terms of both segmentation quality with statistically significant gains, whilst remaining annotation efficient. Furthermore, we explicitly simulate the real-world application by testing our method on four previously unseen datasets without manual adaptation, where all experiment parameters are set according to predefined guidelines. The results confirm that ClaSP PE robustly generalizes to novel tasks without requiring dataset-specific tuning. Within the nnActive framework, we present compelling evidence that an AL method can consistently outperform random baselines adapted to 3D segmentation, in terms of both performance and annotation efficiency in a realistic, close-to-production scenario. Our open-source implementation and clear deployment guidelines make it readily applicable in practice. Code is at https://github.com/MIC-DKFZ/nnActive.
PDF12March 6, 2026