3CAD: un dataset di prodotti 3C su larga scala del mondo reale per l'individuazione non supervisionata di anomalie
3CAD: A Large-Scale Real-World 3C Product Dataset for Unsupervised Anomaly
February 9, 2025
Autori: Enquan Yang, Peng Xing, Hanyang Sun, Wenbo Guo, Yuanwei Ma, Zechao Li, Dan Zeng
cs.AI
Abstract
Il rilevamento delle anomalie industriali sta facendo progressi grazie a set di dati come MVTec-AD e VisA. Tuttavia, essi presentano limitazioni in termini di numero di campioni difettosi, tipi di difetti e disponibilità di scene del mondo reale. Questi vincoli impediscono ai ricercatori di esplorare ulteriormente le prestazioni del rilevamento industriale con maggiore precisione. A questo scopo, proponiamo un nuovo set di dati di rilevamento delle anomalie su larga scala chiamato 3CAD, derivato da vere linee di produzione 3C. In particolare, il 3CAD proposto include otto diversi tipi di parti manufatturate, per un totale di 27.039 immagini ad alta risoluzione etichettate con anomalie a livello di pixel. Le caratteristiche chiave del 3CAD sono che copre regioni anomale di diverse dimensioni, diversi tipi di anomalie e la possibilità di avere più regioni anomale e più tipi di anomalie per immagine anomala. Si tratta del più grande e primo set di dati di rilevamento delle anomalie dedicato al controllo di qualità dei prodotti 3C per l'esplorazione e lo sviluppo della comunità. Nel frattempo, introduciamo un framework semplice ma efficace per il rilevamento delle anomalie non supervisionato: un paradigma di rilevamento Grossolano-a-Fine con Guida al Recupero (CFRG). Per rilevare piccole anomalie difettose, il CFRG proposto utilizza un paradigma di rilevamento grossolano-a-fine. In particolare, utilizziamo un modello di distillazione eterogeneo per la localizzazione grossolana e poi la localizzazione fine attraverso un modello di segmentazione. Inoltre, per catturare meglio i modelli normali, introduciamo caratteristiche di recupero come guida. Infine, riportiamo i risultati del nostro framework CFRG e dei metodi di rilevamento delle anomalie popolari sul set di dati 3CAD, dimostrando una forte competitività e fornendo un benchmark altamente sfidante per promuovere lo sviluppo del campo del rilevamento delle anomalie. Dati e codice sono disponibili: https://github.com/EnquanYang2022/3CAD.
English
Industrial anomaly detection achieves progress thanks to datasets such as
MVTec-AD and VisA. However, they suf- fer from limitations in terms of the
number of defect sam- ples, types of defects, and availability of real-world
scenes. These constraints inhibit researchers from further exploring the
performance of industrial detection with higher accuracy. To this end, we
propose a new large-scale anomaly detection dataset called 3CAD, which is
derived from real 3C produc- tion lines. Specifically, the proposed 3CAD
includes eight different types of manufactured parts, totaling 27,039 high-
resolution images labeled with pixel-level anomalies. The key features of 3CAD
are that it covers anomalous regions of different sizes, multiple anomaly
types, and the possibility of multiple anomalous regions and multiple anomaly
types per anomaly image. This is the largest and first anomaly de- tection
dataset dedicated to 3C product quality control for community exploration and
development. Meanwhile, we in- troduce a simple yet effective framework for
unsupervised anomaly detection: a Coarse-to-Fine detection paradigm with
Recovery Guidance (CFRG). To detect small defect anoma- lies, the proposed CFRG
utilizes a coarse-to-fine detection paradigm. Specifically, we utilize a
heterogeneous distilla- tion model for coarse localization and then fine
localiza- tion through a segmentation model. In addition, to better capture
normal patterns, we introduce recovery features as guidance. Finally, we report
the results of our CFRG frame- work and popular anomaly detection methods on
the 3CAD dataset, demonstrating strong competitiveness and providing a highly
challenging benchmark to promote the development of the anomaly detection
field. Data and code are available: https://github.com/EnquanYang2022/3CAD.Summary
AI-Generated Summary