ProtoGCD: 일반화된 범주 발견을 위한 통합적이고 편향 없는 프로토타입 학습
ProtoGCD: Unified and Unbiased Prototype Learning for Generalized Category Discovery
April 2, 2025
저자: Shijie Ma, Fei Zhu, Xu-Yao Zhang, Cheng-Lin Liu
cs.AI
초록
일반화된 범주 발견(GCD)은 실용적이지만 아직 충분히 탐구되지 않은 문제로, 이는 모델이 기존 클래스의 레이블이 지정된 샘플을 활용하여 새로운 범주를 자동으로 클러스터링하고 발견하도록 요구합니다. 여기서의 도전 과제는 레이블이 없는 데이터가 기존 클래스와 새로운 클래스를 모두 포함한다는 점입니다. 초기 연구에서는 파라미터적 분류기를 사용한 의사 레이블링을 통해 기존 클래스와 새로운 클래스를 별도로 처리했는데, 이는 두 클래스 간의 정확도 불균형을 초래했습니다. 최근의 방법들은 대조 학습을 사용하지만 잠재적인 긍정적 사례를 간과하고 클러스터링 목표와 분리되어 있어 편향된 표현과 차선의 결과를 가져옵니다. 이러한 문제를 해결하기 위해, 우리는 통합적이고 편향되지 않은 프로토타입 학습 프레임워크인 ProtoGCD를 소개합니다. 이 프레임워크에서는 기존 클래스와 새로운 클래스가 공동 프로토타입과 통합 학습 목표로 모델링되어, 기존 클래스와 새로운 클래스 간의 통합 모델링이 가능합니다. 구체적으로, 우리는 확인 편향을 완화하기 위한 이중 수준 적응형 의사 레이블링 메커니즘과 GCD에 더 적합한 표현을 학습하도록 돕는 두 가지 정규화 항을 제안합니다. 또한, 실용적인 고려를 위해 새로운 클래스의 수를 추정하는 기준을 고안했습니다. 더 나아가, ProtoGCD를 확장하여 보이지 않는 이상치를 탐지함으로써 작업 수준의 통합을 달성했습니다. 포괄적인 실험을 통해 ProtoGCD가 일반 및 세분화된 데이터셋에서 최첨단 성능을 달성함을 보여줍니다. 코드는 https://github.com/mashijie1028/ProtoGCD에서 확인할 수 있습니다.
English
Generalized category discovery (GCD) is a pragmatic but underexplored
problem, which requires models to automatically cluster and discover novel
categories by leveraging the labeled samples from old classes. The challenge is
that unlabeled data contain both old and new classes. Early works leveraging
pseudo-labeling with parametric classifiers handle old and new classes
separately, which brings about imbalanced accuracy between them. Recent methods
employing contrastive learning neglect potential positives and are decoupled
from the clustering objective, leading to biased representations and
sub-optimal results. To address these issues, we introduce a unified and
unbiased prototype learning framework, namely ProtoGCD, wherein old and new
classes are modeled with joint prototypes and unified learning objectives,
{enabling unified modeling between old and new classes}. Specifically, we
propose a dual-level adaptive pseudo-labeling mechanism to mitigate
confirmation bias, together with two regularization terms to collectively help
learn more suitable representations for GCD. Moreover, for practical
considerations, we devise a criterion to estimate the number of new classes.
Furthermore, we extend ProtoGCD to detect unseen outliers, achieving task-level
unification. Comprehensive experiments show that ProtoGCD achieves
state-of-the-art performance on both generic and fine-grained datasets. The
code is available at https://github.com/mashijie1028/ProtoGCD.Summary
AI-Generated Summary