ChatPaper.aiChatPaper

Cadre d'Apprentissage Multi-Instance avec Extraction Masquée d'Instances Difficiles pour l'Analyse d'Images Histopathologiques Gigapixels

Multiple Instance Learning Framework with Masked Hard Instance Mining for Gigapixel Histopathology Image Analysis

September 15, 2025
papers.authors: Wenhao Tang, Sheng Huang, Heng Fang, Fengtao Zhou, Bo Liu, Qingshan Liu
cs.AI

papers.abstract

La numérisation d'images pathologiques en images gigapixel de lames entières (Whole Slide Images, WSIs) a ouvert de nouvelles perspectives pour la pathologie computationnelle (Computational Pathology, CPath). Étant donné que les tissus positifs ne représentent qu'une petite fraction des WSIs gigapixel, les méthodes existantes d'apprentissage par instances multiples (Multiple Instance Learning, MIL) se concentrent généralement sur l'identification d'instances saillantes via des mécanismes d'attention. Cependant, cela entraîne un biais en faveur des instances faciles à classer, tout en négligeant celles qui sont plus difficiles. Des études récentes ont montré que les exemples difficiles sont cruciaux pour modéliser avec précision les frontières discriminantes. En appliquant cette idée au niveau des instances, nous développons un nouveau cadre MIL avec extraction masquée d'instances difficiles (Masked Hard Instance Mining, MHIM-MIL), qui utilise une structure Siamese avec une contrainte de cohérence pour explorer les instances difficiles. En utilisant une probabilité d'instance consciente de la classe, MHIM-MIL emploie un enseignant à momentum pour masquer les instances saillantes et extraire implicitement les instances difficiles afin d'entraîner le modèle étudiant. Pour obtenir des instances difficiles diversifiées et non redondantes, nous adoptons un masquage aléatoire à grande échelle tout en utilisant un réseau de recyclage global pour atténuer le risque de perdre des caractéristiques clés. De plus, l'étudiant met à jour l'enseignant en utilisant une moyenne mobile exponentielle, ce qui identifie de nouvelles instances difficiles pour les itérations d'entraînement suivantes et stabilise l'optimisation. Les résultats expérimentaux sur des tâches de diagnostic de cancer, de sous-typage, d'analyse de survie et 12 benchmarks démontrent que MHIM-MIL surpasse les méthodes les plus récentes en termes de performance et d'efficacité. Le code est disponible à l'adresse : https://github.com/DearCaat/MHIM-MIL.
English
Digitizing pathological images into gigapixel Whole Slide Images (WSIs) has opened new avenues for Computational Pathology (CPath). As positive tissue comprises only a small fraction of gigapixel WSIs, existing Multiple Instance Learning (MIL) methods typically focus on identifying salient instances via attention mechanisms. However, this leads to a bias towards easy-to-classify instances while neglecting challenging ones. Recent studies have shown that hard examples are crucial for accurately modeling discriminative boundaries. Applying such an idea at the instance level, we elaborate a novel MIL framework with masked hard instance mining (MHIM-MIL), which utilizes a Siamese structure with a consistency constraint to explore the hard instances. Using a class-aware instance probability, MHIM-MIL employs a momentum teacher to mask salient instances and implicitly mine hard instances for training the student model. To obtain diverse, non-redundant hard instances, we adopt large-scale random masking while utilizing a global recycle network to mitigate the risk of losing key features. Furthermore, the student updates the teacher using an exponential moving average, which identifies new hard instances for subsequent training iterations and stabilizes optimization. Experimental results on cancer diagnosis, subtyping, survival analysis tasks, and 12 benchmarks demonstrate that MHIM-MIL outperforms the latest methods in both performance and efficiency. The code is available at: https://github.com/DearCaat/MHIM-MIL.
PDF12September 17, 2025