ChatPaper.aiChatPaper

ProtoGCD: Vereinheitlichtes und unvoreingenommenes Prototypenlernen für die verallgemeinerte Kategorienentdeckung

ProtoGCD: Unified and Unbiased Prototype Learning for Generalized Category Discovery

April 2, 2025
Autoren: Shijie Ma, Fei Zhu, Xu-Yao Zhang, Cheng-Lin Liu
cs.AI

Zusammenfassung

Die generalisierte Kategorienentdeckung (GCD) ist ein pragmatisches, aber bisher wenig erforschtes Problem, bei dem Modelle automatisch Cluster bilden und neue Kategorien entdecken müssen, indem sie beschriftete Beispiele aus alten Klassen nutzen. Die Herausforderung besteht darin, dass unmarkierte Daten sowohl alte als auch neue Klassen enthalten. Frühere Ansätze, die Pseudolabeling mit parametrischen Klassifikatoren verwenden, behandeln alte und neue Klassen separat, was zu einer unausgewogenen Genauigkeit zwischen ihnen führt. Neuere Methoden, die kontrastives Lernen einsetzen, vernachlässigen potenzielle positive Beispiele und sind vom Clustering-Ziel entkoppelt, was zu verzerrten Darstellungen und suboptimalen Ergebnissen führt. Um diese Probleme zu lösen, führen wir ein einheitliches und unvoreingenommenes Prototypen-Lernframework namens ProtoGCD ein, in dem alte und neue Klassen mit gemeinsamen Prototypen und einheitlichen Lernzielen modelliert werden, wodurch eine einheitliche Modellierung zwischen alten und neuen Klassen ermöglicht wird. Konkret schlagen wir einen zweistufigen adaptiven Pseudolabeling-Mechanismus vor, um Bestätigungsverzerrungen zu mildern, sowie zwei Regularisierungsterme, die gemeinsam dazu beitragen, geeignetere Darstellungen für GCD zu lernen. Darüber hinaus entwickeln wir aus praktischen Erwägungen ein Kriterium zur Schätzung der Anzahl neuer Klassen. Zusätzlich erweitern wir ProtoGCD, um nicht gesehene Ausreißer zu erkennen, wodurch eine Aufgabenebenen-Vereinheitlichung erreicht wird. Umfassende Experimente zeigen, dass ProtoGCD auf generischen und feinkörnigen Datensätzen state-of-the-art Leistungen erzielt. Der Code ist unter https://github.com/mashijie1028/ProtoGCD verfügbar.
English
Generalized category discovery (GCD) is a pragmatic but underexplored problem, which requires models to automatically cluster and discover novel categories by leveraging the labeled samples from old classes. The challenge is that unlabeled data contain both old and new classes. Early works leveraging pseudo-labeling with parametric classifiers handle old and new classes separately, which brings about imbalanced accuracy between them. Recent methods employing contrastive learning neglect potential positives and are decoupled from the clustering objective, leading to biased representations and sub-optimal results. To address these issues, we introduce a unified and unbiased prototype learning framework, namely ProtoGCD, wherein old and new classes are modeled with joint prototypes and unified learning objectives, {enabling unified modeling between old and new classes}. Specifically, we propose a dual-level adaptive pseudo-labeling mechanism to mitigate confirmation bias, together with two regularization terms to collectively help learn more suitable representations for GCD. Moreover, for practical considerations, we devise a criterion to estimate the number of new classes. Furthermore, we extend ProtoGCD to detect unseen outliers, achieving task-level unification. Comprehensive experiments show that ProtoGCD achieves state-of-the-art performance on both generic and fine-grained datasets. The code is available at https://github.com/mashijie1028/ProtoGCD.

Summary

AI-Generated Summary

PDF12April 9, 2025