3CAD : Un ensemble de données de produits 3C à grande échelle dans le monde réel pour la détection d'anomalies non supervisée
3CAD: A Large-Scale Real-World 3C Product Dataset for Unsupervised Anomaly
February 9, 2025
Auteurs: Enquan Yang, Peng Xing, Hanyang Sun, Wenbo Guo, Yuanwei Ma, Zechao Li, Dan Zeng
cs.AI
Résumé
La détection d'anomalies industrielle progresse grâce à des ensembles de données tels que MVTec-AD et VisA. Cependant, ils souffrent de limitations en termes de nombre d'échantillons défectueux, de types de défauts et de disponibilité de scènes du monde réel. Ces contraintes empêchent les chercheurs d'explorer davantage les performances de la détection industrielle avec une précision accrue. À cette fin, nous proposons un nouvel ensemble de données de détection d'anomalies à grande échelle appelé 3CAD, dérivé de véritables lignes de production 3C. Plus précisément, le 3CAD proposé comprend huit types différents de pièces fabriquées, totalisant 27 039 images haute résolution étiquetées avec des anomalies au niveau des pixels. Les caractéristiques clés du 3CAD sont qu'il couvre des régions anormales de tailles différentes, plusieurs types d'anomalies, et la possibilité de plusieurs régions anormales et plusieurs types d'anomalies par image d'anomalie. Il s'agit du plus grand et premier ensemble de données de détection d'anomalies dédié au contrôle de qualité des produits 3C pour l'exploration et le développement communautaires. Parallèlement, nous introduisons un cadre simple mais efficace pour la détection d'anomalies non supervisée : un paradigme de détection Grossière-à-Fine avec Guidage de Récupération (CFRG). Pour détecter de petites anomalies de défaut, le CFRG proposé utilise un paradigme de détection grossière-à-fine. Plus précisément, nous utilisons un modèle de distillation hétérogène pour la localisation grossière, puis une localisation fine à travers un modèle de segmentation. De plus, pour mieux capturer les motifs normaux, nous introduisons des caractéristiques de récupération comme guide. Enfin, nous rapportons les résultats de notre cadre CFRG et des méthodes populaires de détection d'anomalies sur l'ensemble de données 3CAD, démontrant une forte compétitivité et fournissant un benchmark très exigeant pour promouvoir le développement du domaine de la détection d'anomalies. Les données et le code sont disponibles : https://github.com/EnquanYang2022/3CAD.
English
Industrial anomaly detection achieves progress thanks to datasets such as
MVTec-AD and VisA. However, they suf- fer from limitations in terms of the
number of defect sam- ples, types of defects, and availability of real-world
scenes. These constraints inhibit researchers from further exploring the
performance of industrial detection with higher accuracy. To this end, we
propose a new large-scale anomaly detection dataset called 3CAD, which is
derived from real 3C produc- tion lines. Specifically, the proposed 3CAD
includes eight different types of manufactured parts, totaling 27,039 high-
resolution images labeled with pixel-level anomalies. The key features of 3CAD
are that it covers anomalous regions of different sizes, multiple anomaly
types, and the possibility of multiple anomalous regions and multiple anomaly
types per anomaly image. This is the largest and first anomaly de- tection
dataset dedicated to 3C product quality control for community exploration and
development. Meanwhile, we in- troduce a simple yet effective framework for
unsupervised anomaly detection: a Coarse-to-Fine detection paradigm with
Recovery Guidance (CFRG). To detect small defect anoma- lies, the proposed CFRG
utilizes a coarse-to-fine detection paradigm. Specifically, we utilize a
heterogeneous distilla- tion model for coarse localization and then fine
localiza- tion through a segmentation model. In addition, to better capture
normal patterns, we introduce recovery features as guidance. Finally, we report
the results of our CFRG frame- work and popular anomaly detection methods on
the 3CAD dataset, demonstrating strong competitiveness and providing a highly
challenging benchmark to promote the development of the anomaly detection
field. Data and code are available: https://github.com/EnquanYang2022/3CAD.Summary
AI-Generated Summary