Meervoudige Instantie Leerframework met Gemaskeerde Harde Instantie Mijnbouw voor Gigapixel Histopathologie Beeldanalyse
Multiple Instance Learning Framework with Masked Hard Instance Mining for Gigapixel Histopathology Image Analysis
September 15, 2025
Auteurs: Wenhao Tang, Sheng Huang, Heng Fang, Fengtao Zhou, Bo Liu, Qingshan Liu
cs.AI
Samenvatting
Het digitaliseren van pathologische afbeeldingen naar gigapixel Whole Slide Images (WSI's) heeft nieuwe mogelijkheden geopend voor Computational Pathology (CPath). Omdat positief weefsel slechts een klein deel uitmaakt van gigapixel WSI's, richten bestaande Multiple Instance Learning (MIL) methoden zich doorgaans op het identificeren van opvallende instanties via aandachtmechanismen. Dit leidt echter tot een vooroordeel ten gunste van gemakkelijk te classificeren instanties, terwijl uitdagende instanties worden verwaarloosd. Recente studies hebben aangetoond dat moeilijke voorbeelden cruciaal zijn voor het nauwkeurig modelleren van discriminerende grenzen. Door dit idee toe te passen op instantieniveau, ontwikkelen we een nieuw MIL-framework met gemaskeerde harde instantie-mining (MHIM-MIL), dat een Siamese structuur met een consistentiebeperking gebruikt om de moeilijke instanties te verkennen. Met behulp van een klassebewuste instantiekans gebruikt MHIM-MIL een momentumleraar om opvallende instanties te maskeren en impliciet moeilijke instanties te minen voor het trainen van het studentmodel. Om diverse, niet-redundante moeilijke instanties te verkrijgen, passen we grootschalige willekeurige masking toe terwijl we een globaal recyclenetwerk gebruiken om het risico van het verliezen van belangrijke kenmerken te beperken. Bovendien werkt de student de leraar bij met een exponentieel voortschrijdend gemiddelde, wat nieuwe moeilijke instanties identificeert voor volgende trainingsiteraties en de optimalisatie stabiliseert. Experimentele resultaten op taken voor kankerdiagnose, subtypering, overlevingsanalyse en 12 benchmarks tonen aan dat MHIM-MIL de nieuwste methoden overtreft in zowel prestaties als efficiëntie. De code is beschikbaar op: https://github.com/DearCaat/MHIM-MIL.
English
Digitizing pathological images into gigapixel Whole Slide Images (WSIs) has
opened new avenues for Computational Pathology (CPath). As positive tissue
comprises only a small fraction of gigapixel WSIs, existing Multiple Instance
Learning (MIL) methods typically focus on identifying salient instances via
attention mechanisms. However, this leads to a bias towards easy-to-classify
instances while neglecting challenging ones. Recent studies have shown that
hard examples are crucial for accurately modeling discriminative boundaries.
Applying such an idea at the instance level, we elaborate a novel MIL framework
with masked hard instance mining (MHIM-MIL), which utilizes a Siamese structure
with a consistency constraint to explore the hard instances. Using a
class-aware instance probability, MHIM-MIL employs a momentum teacher to mask
salient instances and implicitly mine hard instances for training the student
model. To obtain diverse, non-redundant hard instances, we adopt large-scale
random masking while utilizing a global recycle network to mitigate the risk of
losing key features. Furthermore, the student updates the teacher using an
exponential moving average, which identifies new hard instances for subsequent
training iterations and stabilizes optimization. Experimental results on cancer
diagnosis, subtyping, survival analysis tasks, and 12 benchmarks demonstrate
that MHIM-MIL outperforms the latest methods in both performance and
efficiency. The code is available at: https://github.com/DearCaat/MHIM-MIL.