ProtoGCD: Vereinheitlichtes und unvoreingenommenes Prototypenlernen für die verallgemeinerte Kategorienentdeckung
ProtoGCD: Unified and Unbiased Prototype Learning for Generalized Category Discovery
April 2, 2025
Autoren: Shijie Ma, Fei Zhu, Xu-Yao Zhang, Cheng-Lin Liu
cs.AI
Zusammenfassung
Die generalisierte Kategorienentdeckung (GCD) ist ein pragmatisches, aber bisher wenig erforschtes Problem, bei dem Modelle automatisch Cluster bilden und neue Kategorien entdecken müssen, indem sie beschriftete Beispiele aus alten Klassen nutzen. Die Herausforderung besteht darin, dass unmarkierte Daten sowohl alte als auch neue Klassen enthalten. Frühere Ansätze, die Pseudolabeling mit parametrischen Klassifikatoren verwenden, behandeln alte und neue Klassen separat, was zu einer unausgewogenen Genauigkeit zwischen ihnen führt. Neuere Methoden, die kontrastives Lernen einsetzen, vernachlässigen potenzielle positive Beispiele und sind vom Clustering-Ziel entkoppelt, was zu verzerrten Darstellungen und suboptimalen Ergebnissen führt. Um diese Probleme zu lösen, führen wir ein einheitliches und unvoreingenommenes Prototypen-Lernframework namens ProtoGCD ein, in dem alte und neue Klassen mit gemeinsamen Prototypen und einheitlichen Lernzielen modelliert werden, wodurch eine einheitliche Modellierung zwischen alten und neuen Klassen ermöglicht wird. Konkret schlagen wir einen zweistufigen adaptiven Pseudolabeling-Mechanismus vor, um Bestätigungsverzerrungen zu mildern, sowie zwei Regularisierungsterme, die gemeinsam dazu beitragen, geeignetere Darstellungen für GCD zu lernen. Darüber hinaus entwickeln wir aus praktischen Erwägungen ein Kriterium zur Schätzung der Anzahl neuer Klassen. Zusätzlich erweitern wir ProtoGCD, um nicht gesehene Ausreißer zu erkennen, wodurch eine Aufgabenebenen-Vereinheitlichung erreicht wird. Umfassende Experimente zeigen, dass ProtoGCD auf generischen und feinkörnigen Datensätzen state-of-the-art Leistungen erzielt. Der Code ist unter https://github.com/mashijie1028/ProtoGCD verfügbar.
English
Generalized category discovery (GCD) is a pragmatic but underexplored
problem, which requires models to automatically cluster and discover novel
categories by leveraging the labeled samples from old classes. The challenge is
that unlabeled data contain both old and new classes. Early works leveraging
pseudo-labeling with parametric classifiers handle old and new classes
separately, which brings about imbalanced accuracy between them. Recent methods
employing contrastive learning neglect potential positives and are decoupled
from the clustering objective, leading to biased representations and
sub-optimal results. To address these issues, we introduce a unified and
unbiased prototype learning framework, namely ProtoGCD, wherein old and new
classes are modeled with joint prototypes and unified learning objectives,
{enabling unified modeling between old and new classes}. Specifically, we
propose a dual-level adaptive pseudo-labeling mechanism to mitigate
confirmation bias, together with two regularization terms to collectively help
learn more suitable representations for GCD. Moreover, for practical
considerations, we devise a criterion to estimate the number of new classes.
Furthermore, we extend ProtoGCD to detect unseen outliers, achieving task-level
unification. Comprehensive experiments show that ProtoGCD achieves
state-of-the-art performance on both generic and fine-grained datasets. The
code is available at https://github.com/mashijie1028/ProtoGCD.Summary
AI-Generated Summary