ProtoGCD : Apprentissage unifié et impartial de prototypes pour la découverte généralisée de catégories

papers.abstract

La découverte généralisée de catégories (GCD) est un problème pragmatique mais sous-exploré, qui nécessite que les modèles regroupent et découvrent automatiquement de nouvelles catégories en exploitant les échantillons étiquetés des anciennes classes. Le défi réside dans le fait que les données non étiquetées contiennent à la fois des anciennes et des nouvelles classes. Les travaux antérieurs utilisant l'étiquetage pseudo-supervisé avec des classificateurs paramétriques traitent les anciennes et les nouvelles classes séparément, ce qui entraîne une précision déséquilibrée entre elles. Les méthodes récentes employant l'apprentissage contrastif négligent les positifs potentiels et sont découplées de l'objectif de regroupement, conduisant à des représentations biaisées et à des résultats sous-optimaux. Pour résoudre ces problèmes, nous introduisons un cadre d'apprentissage de prototypes unifié et non biaisé, nommé ProtoGCD, dans lequel les anciennes et les nouvelles classes sont modélisées avec des prototypes conjoints et des objectifs d'apprentissage unifiés, {permettant une modélisation unifiée entre les anciennes et les nouvelles classes}. Plus précisément, nous proposons un mécanisme d'étiquetage pseudo-supervisé adaptatif à double niveau pour atténuer le biais de confirmation, ainsi que deux termes de régularisation pour aider collectivement à apprendre des représentations plus adaptées pour la GCD. De plus, pour des considérations pratiques, nous concevons un critère pour estimer le nombre de nouvelles classes. Par ailleurs, nous étendons ProtoGCD pour détecter les valeurs aberrantes non vues, atteignant ainsi une unification au niveau de la tâche. Des expériences approfondies montrent que ProtoGCD atteint des performances de pointe sur des ensembles de données génériques et spécifiques. Le code est disponible à l'adresse https://github.com/mashijie1028/ProtoGCD.

English

Generalized category discovery (GCD) is a pragmatic but underexplored problem, which requires models to automatically cluster and discover novel categories by leveraging the labeled samples from old classes. The challenge is that unlabeled data contain both old and new classes. Early works leveraging pseudo-labeling with parametric classifiers handle old and new classes separately, which brings about imbalanced accuracy between them. Recent methods employing contrastive learning neglect potential positives and are decoupled from the clustering objective, leading to biased representations and sub-optimal results. To address these issues, we introduce a unified and unbiased prototype learning framework, namely ProtoGCD, wherein old and new classes are modeled with joint prototypes and unified learning objectives, {enabling unified modeling between old and new classes}. Specifically, we propose a dual-level adaptive pseudo-labeling mechanism to mitigate confirmation bias, together with two regularization terms to collectively help learn more suitable representations for GCD. Moreover, for practical considerations, we devise a criterion to estimate the number of new classes. Furthermore, we extend ProtoGCD to detect unseen outliers, achieving task-level unification. Comprehensive experiments show that ProtoGCD achieves state-of-the-art performance on both generic and fine-grained datasets. The code is available at https://github.com/mashijie1028/ProtoGCD.

ProtoGCD : Apprentissage unifié et impartial de prototypes pour la découverte généralisée de catégories

ProtoGCD: Unified and Unbiased Prototype Learning for Generalized Category Discovery

papers.abstract

Support