Hibou: 병리학을 위한 기초 비전 트랜스포머 패밀리
Hibou: A Family of Foundational Vision Transformers for Pathology
June 7, 2024
저자: Dmitry Nechaev, Alexey Pchelnikov, Ekaterina Ivanova
cs.AI
초록
병리학은 질병에 걸린 조직을 현미경으로 관찰하여 다양한 의학적 상태, 특히 암을 진단하는 데 중요한 역할을 합니다. 전통적인 방법은 노동 집약적이며 인간의 실수가 발생하기 쉽습니다. 디지털 병리학은 유리 슬라이드를 고해상도 디지털 이미지로 변환하여 컴퓨터 알고리즘으로 분석함으로써, 자동화된 이미지 분석과 대규모 데이터 처리를 통해 진단의 정확성, 일관성 및 효율성을 향상시켜 이 분야를 혁신하고 있습니다. 기초 트랜스포머 사전 학습은 방대한 양의 주석이 없는 데이터로부터 학습할 수 있게 함으로써 강력하고 일반화 가능한 모델 개발에 중요합니다.
본 논문은 다양한 조직 유형과 염색 기술을 대표하는 100만 장 이상의 전체 슬라이드 이미지(WSI)로 구성된 독점 데이터셋을 사용하여 DINOv2 프레임워크를 활용해 Hibou-B와 Hibou-L 두 가지 모델 변형을 사전 학습한 병리학용 기초 비전 트랜스포머인 Hibou 패밀리를 소개합니다. 우리의 사전 학습된 모델은 패치 수준과 슬라이드 수준 벤치마크 모두에서 기존의 최첨단 방법을 능가하는 우수한 성능을 보여줍니다. 특히, Hibou-L은 여러 벤치마크 데이터셋에서 가장 높은 평균 정확도를 달성했습니다. 이 분야의 추가 연구와 응용을 지원하기 위해 Hibou-B 모델을 오픈소스로 공개했으며, https://github.com/HistAI/hibou에서 접근할 수 있습니다.
English
Pathology, the microscopic examination of diseased tissue, is critical for
diagnosing various medical conditions, particularly cancers. Traditional
methods are labor-intensive and prone to human error. Digital pathology, which
converts glass slides into high-resolution digital images for analysis by
computer algorithms, revolutionizes the field by enhancing diagnostic accuracy,
consistency, and efficiency through automated image analysis and large-scale
data processing. Foundational transformer pretraining is crucial for developing
robust, generalizable models as it enables learning from vast amounts of
unannotated data.
This paper introduces the Hibou family of foundational vision transformers
for pathology, leveraging the DINOv2 framework to pretrain two model variants,
Hibou-B and Hibou-L, on a proprietary dataset of over 1 million whole slide
images (WSIs) representing diverse tissue types and staining techniques. Our
pretrained models demonstrate superior performance on both patch-level and
slide-level benchmarks, surpassing existing state-of-the-art methods. Notably,
Hibou-L achieves the highest average accuracy across multiple benchmark
datasets. To support further research and application in the field, we have
open-sourced the Hibou-B model, which can be accessed at
https://github.com/HistAI/hibou