ProtoGCD: Aprendizaje Unificado e Imparcial de Prototipos para el Descubrimiento Generalizado de Categorías
ProtoGCD: Unified and Unbiased Prototype Learning for Generalized Category Discovery
April 2, 2025
Autores: Shijie Ma, Fei Zhu, Xu-Yao Zhang, Cheng-Lin Liu
cs.AI
Resumen
El descubrimiento de categorías generalizado (GCD, por sus siglas en inglés) es un problema pragmático pero poco explorado, que requiere que los modelos agrupen y descubran automáticamente categorías novedosas aprovechando las muestras etiquetadas de clases antiguas. El desafío radica en que los datos no etiquetados contienen tanto clases antiguas como nuevas. Los primeros trabajos que utilizan pseudoetiquetado con clasificadores paramétricos manejan las clases antiguas y nuevas por separado, lo que genera un desequilibrio en la precisión entre ellas. Los métodos recientes que emplean aprendizaje contrastivo descuidan los positivos potenciales y están desacoplados del objetivo de agrupamiento, lo que conduce a representaciones sesgadas y resultados subóptimos. Para abordar estos problemas, presentamos un marco de aprendizaje de prototipos unificado y no sesgado, denominado ProtoGCD, en el que las clases antiguas y nuevas se modelan con prototipos conjuntos y objetivos de aprendizaje unificados, {permitiendo un modelado unificado entre clases antiguas y nuevas}. Específicamente, proponemos un mecanismo de pseudoetiquetado adaptativo de doble nivel para mitigar el sesgo de confirmación, junto con dos términos de regularización que ayudan colectivamente a aprender representaciones más adecuadas para GCD. Además, por consideraciones prácticas, diseñamos un criterio para estimar el número de clases nuevas. Asimismo, extendemos ProtoGCD para detectar valores atípicos no vistos, logrando una unificación a nivel de tarea. Experimentos exhaustivos muestran que ProtoGCD alcanza un rendimiento de vanguardia tanto en conjuntos de datos genéricos como en aquellos de grano fino. El código está disponible en https://github.com/mashijie1028/ProtoGCD.
English
Generalized category discovery (GCD) is a pragmatic but underexplored
problem, which requires models to automatically cluster and discover novel
categories by leveraging the labeled samples from old classes. The challenge is
that unlabeled data contain both old and new classes. Early works leveraging
pseudo-labeling with parametric classifiers handle old and new classes
separately, which brings about imbalanced accuracy between them. Recent methods
employing contrastive learning neglect potential positives and are decoupled
from the clustering objective, leading to biased representations and
sub-optimal results. To address these issues, we introduce a unified and
unbiased prototype learning framework, namely ProtoGCD, wherein old and new
classes are modeled with joint prototypes and unified learning objectives,
{enabling unified modeling between old and new classes}. Specifically, we
propose a dual-level adaptive pseudo-labeling mechanism to mitigate
confirmation bias, together with two regularization terms to collectively help
learn more suitable representations for GCD. Moreover, for practical
considerations, we devise a criterion to estimate the number of new classes.
Furthermore, we extend ProtoGCD to detect unseen outliers, achieving task-level
unification. Comprehensive experiments show that ProtoGCD achieves
state-of-the-art performance on both generic and fine-grained datasets. The
code is available at https://github.com/mashijie1028/ProtoGCD.Summary
AI-Generated Summary