ProtoGCD: Aprendizaje Unificado e Imparcial de Prototipos para el Descubrimiento Generalizado de Categorías

Resumen

El descubrimiento de categorías generalizado (GCD, por sus siglas en inglés) es un problema pragmático pero poco explorado, que requiere que los modelos agrupen y descubran automáticamente categorías novedosas aprovechando las muestras etiquetadas de clases antiguas. El desafío radica en que los datos no etiquetados contienen tanto clases antiguas como nuevas. Los primeros trabajos que utilizan pseudoetiquetado con clasificadores paramétricos manejan las clases antiguas y nuevas por separado, lo que genera un desequilibrio en la precisión entre ellas. Los métodos recientes que emplean aprendizaje contrastivo descuidan los positivos potenciales y están desacoplados del objetivo de agrupamiento, lo que conduce a representaciones sesgadas y resultados subóptimos. Para abordar estos problemas, presentamos un marco de aprendizaje de prototipos unificado y no sesgado, denominado ProtoGCD, en el que las clases antiguas y nuevas se modelan con prototipos conjuntos y objetivos de aprendizaje unificados, {permitiendo un modelado unificado entre clases antiguas y nuevas}. Específicamente, proponemos un mecanismo de pseudoetiquetado adaptativo de doble nivel para mitigar el sesgo de confirmación, junto con dos términos de regularización que ayudan colectivamente a aprender representaciones más adecuadas para GCD. Además, por consideraciones prácticas, diseñamos un criterio para estimar el número de clases nuevas. Asimismo, extendemos ProtoGCD para detectar valores atípicos no vistos, logrando una unificación a nivel de tarea. Experimentos exhaustivos muestran que ProtoGCD alcanza un rendimiento de vanguardia tanto en conjuntos de datos genéricos como en aquellos de grano fino. El código está disponible en https://github.com/mashijie1028/ProtoGCD.

English

Generalized category discovery (GCD) is a pragmatic but underexplored problem, which requires models to automatically cluster and discover novel categories by leveraging the labeled samples from old classes. The challenge is that unlabeled data contain both old and new classes. Early works leveraging pseudo-labeling with parametric classifiers handle old and new classes separately, which brings about imbalanced accuracy between them. Recent methods employing contrastive learning neglect potential positives and are decoupled from the clustering objective, leading to biased representations and sub-optimal results. To address these issues, we introduce a unified and unbiased prototype learning framework, namely ProtoGCD, wherein old and new classes are modeled with joint prototypes and unified learning objectives, {enabling unified modeling between old and new classes}. Specifically, we propose a dual-level adaptive pseudo-labeling mechanism to mitigate confirmation bias, together with two regularization terms to collectively help learn more suitable representations for GCD. Moreover, for practical considerations, we devise a criterion to estimate the number of new classes. Furthermore, we extend ProtoGCD to detect unseen outliers, achieving task-level unification. Comprehensive experiments show that ProtoGCD achieves state-of-the-art performance on both generic and fine-grained datasets. The code is available at https://github.com/mashijie1028/ProtoGCD.

ProtoGCD: Aprendizaje Unificado e Imparcial de Prototipos para el Descubrimiento Generalizado de Categorías

ProtoGCD: Unified and Unbiased Prototype Learning for Generalized Category Discovery

Resumen

Support