ChatPaper.aiChatPaper

Hibou: Uma Família de Transformadores Visuais Fundamentais para Patologia

Hibou: A Family of Foundational Vision Transformers for Pathology

June 7, 2024
Autores: Dmitry Nechaev, Alexey Pchelnikov, Ekaterina Ivanova
cs.AI

Resumo

A patologia, o exame microscópico de tecidos doentes, é crucial para o diagnóstico de diversas condições médicas, especialmente cânceres. Os métodos tradicionais são intensivos em mão de obra e propensos a erros humanos. A patologia digital, que converte lâminas de vidro em imagens digitais de alta resolução para análise por algoritmos computacionais, revoluciona o campo ao aprimorar a precisão, consistência e eficiência diagnóstica por meio da análise automatizada de imagens e do processamento de dados em larga escala. O pré-treinamento de transformadores fundamentais é essencial para o desenvolvimento de modelos robustos e generalizáveis, pois permite o aprendizado a partir de grandes quantidades de dados não anotados. Este artigo apresenta a família Hibou de transformadores de visão fundamentais para patologia, utilizando o framework DINOv2 para pré-treinar duas variantes de modelo, Hibou-B e Hibou-L, em um conjunto de dados proprietário de mais de 1 milhão de imagens de lâminas inteiras (WSIs) que representam diversos tipos de tecidos e técnicas de coloração. Nossos modelos pré-treinados demonstram desempenho superior em benchmarks tanto em nível de fragmento quanto de lâmina, superando os métodos state-of-the-art existentes. Notavelmente, o Hibou-L alcança a maior precisão média em múltiplos conjuntos de dados de benchmark. Para apoiar pesquisas e aplicações futuras na área, disponibilizamos o modelo Hibou-B em código aberto, que pode ser acessado em https://github.com/HistAI/hibou.
English
Pathology, the microscopic examination of diseased tissue, is critical for diagnosing various medical conditions, particularly cancers. Traditional methods are labor-intensive and prone to human error. Digital pathology, which converts glass slides into high-resolution digital images for analysis by computer algorithms, revolutionizes the field by enhancing diagnostic accuracy, consistency, and efficiency through automated image analysis and large-scale data processing. Foundational transformer pretraining is crucial for developing robust, generalizable models as it enables learning from vast amounts of unannotated data. This paper introduces the Hibou family of foundational vision transformers for pathology, leveraging the DINOv2 framework to pretrain two model variants, Hibou-B and Hibou-L, on a proprietary dataset of over 1 million whole slide images (WSIs) representing diverse tissue types and staining techniques. Our pretrained models demonstrate superior performance on both patch-level and slide-level benchmarks, surpassing existing state-of-the-art methods. Notably, Hibou-L achieves the highest average accuracy across multiple benchmark datasets. To support further research and application in the field, we have open-sourced the Hibou-B model, which can be accessed at https://github.com/HistAI/hibou
PDF91December 8, 2024