3CAD: Um Conjunto de Dados de Produtos 3C do Mundo Real em Grande Escala para Anomalia Não Supervisionada
3CAD: A Large-Scale Real-World 3C Product Dataset for Unsupervised Anomaly
February 9, 2025
Autores: Enquan Yang, Peng Xing, Hanyang Sun, Wenbo Guo, Yuanwei Ma, Zechao Li, Dan Zeng
cs.AI
Resumo
A detecção de anomalias industrial avança graças a conjuntos de dados como MVTec-AD e VisA. No entanto, eles sofrem de limitações em termos do número de amostras de defeitos, tipos de defeitos e disponibilidade de cenas do mundo real. Essas restrições impedem os pesquisadores de explorar ainda mais o desempenho da detecção industrial com maior precisão. Para isso, propomos um novo conjunto de dados de detecção de anomalias em larga escala chamado 3CAD, derivado de linhas de produção 3C reais. Especificamente, o 3CAD proposto inclui oito tipos diferentes de peças fabricadas, totalizando 27.039 imagens de alta resolução rotuladas com anomalias ao nível de pixel. As principais características do 3CAD são que ele abrange regiões anômalas de diferentes tamanhos, múltiplos tipos de anomalias e a possibilidade de múltiplas regiões anômalas e múltiplos tipos de anomalias por imagem anômala. Este é o maior e primeiro conjunto de dados de detecção de anomalias dedicado ao controle de qualidade de produtos 3C para exploração e desenvolvimento pela comunidade. Enquanto isso, introduzimos um framework simples, porém eficaz, para detecção de anomalias não supervisionada: um paradigma de detecção de Coarse-to-Fine com Orientação de Recuperação (CFRG). Para detectar pequenas anomalias de defeito, o CFRG proposto utiliza um paradigma de detecção coarse-to-fine. Especificamente, utilizamos um modelo de destilação heterogêneo para localização grosseira e depois localização fina por meio de um modelo de segmentação. Além disso, para capturar melhor padrões normais, introduzimos características de recuperação como orientação. Por fim, relatamos os resultados de nosso framework CFRG e métodos populares de detecção de anomalias no conjunto de dados 3CAD, demonstrando forte competitividade e fornecendo um benchmark altamente desafiador para promover o desenvolvimento do campo de detecção de anomalias. Os dados e o código estão disponíveis em: https://github.com/EnquanYang2022/3CAD.
English
Industrial anomaly detection achieves progress thanks to datasets such as
MVTec-AD and VisA. However, they suf- fer from limitations in terms of the
number of defect sam- ples, types of defects, and availability of real-world
scenes. These constraints inhibit researchers from further exploring the
performance of industrial detection with higher accuracy. To this end, we
propose a new large-scale anomaly detection dataset called 3CAD, which is
derived from real 3C produc- tion lines. Specifically, the proposed 3CAD
includes eight different types of manufactured parts, totaling 27,039 high-
resolution images labeled with pixel-level anomalies. The key features of 3CAD
are that it covers anomalous regions of different sizes, multiple anomaly
types, and the possibility of multiple anomalous regions and multiple anomaly
types per anomaly image. This is the largest and first anomaly de- tection
dataset dedicated to 3C product quality control for community exploration and
development. Meanwhile, we in- troduce a simple yet effective framework for
unsupervised anomaly detection: a Coarse-to-Fine detection paradigm with
Recovery Guidance (CFRG). To detect small defect anoma- lies, the proposed CFRG
utilizes a coarse-to-fine detection paradigm. Specifically, we utilize a
heterogeneous distilla- tion model for coarse localization and then fine
localiza- tion through a segmentation model. In addition, to better capture
normal patterns, we introduce recovery features as guidance. Finally, we report
the results of our CFRG frame- work and popular anomaly detection methods on
the 3CAD dataset, demonstrating strong competitiveness and providing a highly
challenging benchmark to promote the development of the anomaly detection
field. Data and code are available: https://github.com/EnquanYang2022/3CAD.Summary
AI-Generated Summary