ProtoGCD : Apprentissage unifié et impartial de prototypes pour la découverte généralisée de catégories
ProtoGCD: Unified and Unbiased Prototype Learning for Generalized Category Discovery
April 2, 2025
Auteurs: Shijie Ma, Fei Zhu, Xu-Yao Zhang, Cheng-Lin Liu
cs.AI
Résumé
La découverte généralisée de catégories (GCD) est un problème pragmatique mais sous-exploré, qui nécessite que les modèles regroupent et découvrent automatiquement de nouvelles catégories en exploitant les échantillons étiquetés des anciennes classes. Le défi réside dans le fait que les données non étiquetées contiennent à la fois des anciennes et des nouvelles classes. Les travaux antérieurs utilisant l'étiquetage pseudo-supervisé avec des classificateurs paramétriques traitent les anciennes et les nouvelles classes séparément, ce qui entraîne une précision déséquilibrée entre elles. Les méthodes récentes employant l'apprentissage contrastif négligent les positifs potentiels et sont découplées de l'objectif de regroupement, conduisant à des représentations biaisées et à des résultats sous-optimaux. Pour résoudre ces problèmes, nous introduisons un cadre d'apprentissage de prototypes unifié et non biaisé, nommé ProtoGCD, dans lequel les anciennes et les nouvelles classes sont modélisées avec des prototypes conjoints et des objectifs d'apprentissage unifiés, {permettant une modélisation unifiée entre les anciennes et les nouvelles classes}. Plus précisément, nous proposons un mécanisme d'étiquetage pseudo-supervisé adaptatif à double niveau pour atténuer le biais de confirmation, ainsi que deux termes de régularisation pour aider collectivement à apprendre des représentations plus adaptées pour la GCD. De plus, pour des considérations pratiques, nous concevons un critère pour estimer le nombre de nouvelles classes. Par ailleurs, nous étendons ProtoGCD pour détecter les valeurs aberrantes non vues, atteignant ainsi une unification au niveau de la tâche. Des expériences approfondies montrent que ProtoGCD atteint des performances de pointe sur des ensembles de données génériques et spécifiques. Le code est disponible à l'adresse https://github.com/mashijie1028/ProtoGCD.
English
Generalized category discovery (GCD) is a pragmatic but underexplored
problem, which requires models to automatically cluster and discover novel
categories by leveraging the labeled samples from old classes. The challenge is
that unlabeled data contain both old and new classes. Early works leveraging
pseudo-labeling with parametric classifiers handle old and new classes
separately, which brings about imbalanced accuracy between them. Recent methods
employing contrastive learning neglect potential positives and are decoupled
from the clustering objective, leading to biased representations and
sub-optimal results. To address these issues, we introduce a unified and
unbiased prototype learning framework, namely ProtoGCD, wherein old and new
classes are modeled with joint prototypes and unified learning objectives,
{enabling unified modeling between old and new classes}. Specifically, we
propose a dual-level adaptive pseudo-labeling mechanism to mitigate
confirmation bias, together with two regularization terms to collectively help
learn more suitable representations for GCD. Moreover, for practical
considerations, we devise a criterion to estimate the number of new classes.
Furthermore, we extend ProtoGCD to detect unseen outliers, achieving task-level
unification. Comprehensive experiments show that ProtoGCD achieves
state-of-the-art performance on both generic and fine-grained datasets. The
code is available at https://github.com/mashijie1028/ProtoGCD.Summary
AI-Generated Summary