ProtoGCD: Geünificeerd en Onbevooroordeeld Prototype Leren voor Gegeneraliseerde Categorieontdekking
ProtoGCD: Unified and Unbiased Prototype Learning for Generalized Category Discovery
April 2, 2025
Auteurs: Shijie Ma, Fei Zhu, Xu-Yao Zhang, Cheng-Lin Liu
cs.AI
Samenvatting
Gegeneraliseerde categorieontdekking (GCD) is een pragmatisch maar onderbelicht probleem, waarbij modellen automatisch nieuwe categorieën moeten clusteren en ontdekken door gebruik te maken van gelabelde voorbeelden uit oude klassen. De uitdaging is dat ongelabelde gegevens zowel oude als nieuwe klassen bevatten. Vroege werken die gebruikmaken van pseudo-labeling met parametrische classificatoren behandelen oude en nieuwe klassen afzonderlijk, wat leidt tot een onbalans in nauwkeurigheid tussen beide. Recente methoden die contrastief leren toepassen, negeren potentiële positieven en zijn losgekoppeld van het clusteringdoel, wat resulteert in bevooroordeelde representaties en suboptimale resultaten. Om deze problemen aan te pakken, introduceren we een uniform en onbevooroordeeld prototype-leerkader, genaamd ProtoGCD, waarin oude en nieuwe klassen worden gemodelleerd met gezamenlijke prototypes en uniforme leerdoelen, waardoor een uniforme modellering tussen oude en nieuwe klassen mogelijk wordt. Specifiek stellen we een dubbelniveau adaptief pseudo-labelingmechanisme voor om bevestigingsbias te verminderen, samen met twee regularisatietermen om gezamenlijk geschiktere representaties voor GCD te leren. Bovendien, voor praktische overwegingen, ontwikkelen we een criterium om het aantal nieuwe klassen te schatten. Verder breiden we ProtoGCD uit om onzichtbare uitschieters te detecteren, waardoor taakniveau-unificatie wordt bereikt. Uitgebreide experimenten tonen aan dat ProtoGCD state-of-the-art prestaties behaalt op zowel generieke als fijnmazige datasets. De code is beschikbaar op https://github.com/mashijie1028/ProtoGCD.
English
Generalized category discovery (GCD) is a pragmatic but underexplored
problem, which requires models to automatically cluster and discover novel
categories by leveraging the labeled samples from old classes. The challenge is
that unlabeled data contain both old and new classes. Early works leveraging
pseudo-labeling with parametric classifiers handle old and new classes
separately, which brings about imbalanced accuracy between them. Recent methods
employing contrastive learning neglect potential positives and are decoupled
from the clustering objective, leading to biased representations and
sub-optimal results. To address these issues, we introduce a unified and
unbiased prototype learning framework, namely ProtoGCD, wherein old and new
classes are modeled with joint prototypes and unified learning objectives,
{enabling unified modeling between old and new classes}. Specifically, we
propose a dual-level adaptive pseudo-labeling mechanism to mitigate
confirmation bias, together with two regularization terms to collectively help
learn more suitable representations for GCD. Moreover, for practical
considerations, we devise a criterion to estimate the number of new classes.
Furthermore, we extend ProtoGCD to detect unseen outliers, achieving task-level
unification. Comprehensive experiments show that ProtoGCD achieves
state-of-the-art performance on both generic and fine-grained datasets. The
code is available at https://github.com/mashijie1028/ProtoGCD.Summary
AI-Generated Summary