3CAD: Un conjunto de datos de productos 3C del mundo real a gran escala para la detección de anomalías no supervisada.
3CAD: A Large-Scale Real-World 3C Product Dataset for Unsupervised Anomaly
February 9, 2025
Autores: Enquan Yang, Peng Xing, Hanyang Sun, Wenbo Guo, Yuanwei Ma, Zechao Li, Dan Zeng
cs.AI
Resumen
La detección de anomalías industriales ha avanzado gracias a conjuntos de datos como MVTec-AD y VisA. Sin embargo, estos sufren limitaciones en cuanto al número de muestras defectuosas, tipos de defectos y disponibilidad de escenas del mundo real. Estas restricciones impiden a los investigadores explorar más a fondo el rendimiento de la detección industrial con mayor precisión. Con este fin, proponemos un nuevo conjunto de datos de detección de anomalías a gran escala llamado 3CAD, derivado de líneas de producción reales de 3C. Específicamente, el 3CAD propuesto incluye ocho tipos diferentes de piezas fabricadas, con un total de 27,039 imágenes de alta resolución etiquetadas con anomalías a nivel de píxel. Las características clave del 3CAD son que cubre regiones anómalas de diferentes tamaños, múltiples tipos de anomalías y la posibilidad de múltiples regiones anómalas y múltiples tipos de anomalías por imagen anómala. Este es el conjunto de datos de detección de anomalías más grande y el primero dedicado al control de calidad de productos 3C para la exploración y desarrollo de la comunidad. Mientras tanto, presentamos un marco simple pero efectivo para la detección de anomalías no supervisada: un paradigma de detección de Grueso a Fino con Guía de Recuperación (CFRG). Para detectar pequeñas anomalías de defecto, el CFRG propuesto utiliza un paradigma de detección de grueso a fino. Específicamente, utilizamos un modelo de destilación heterogéneo para la localización gruesa y luego la localización fina a través de un modelo de segmentación. Además, para capturar mejor los patrones normales, introducimos características de recuperación como guía. Finalmente, informamos los resultados de nuestro marco CFRG y de métodos populares de detección de anomalías en el conjunto de datos 3CAD, demostrando una fuerte competitividad y proporcionando un punto de referencia altamente desafiante para promover el desarrollo del campo de detección de anomalías. Los datos y el código están disponibles en: https://github.com/EnquanYang2022/3CAD.
English
Industrial anomaly detection achieves progress thanks to datasets such as
MVTec-AD and VisA. However, they suf- fer from limitations in terms of the
number of defect sam- ples, types of defects, and availability of real-world
scenes. These constraints inhibit researchers from further exploring the
performance of industrial detection with higher accuracy. To this end, we
propose a new large-scale anomaly detection dataset called 3CAD, which is
derived from real 3C produc- tion lines. Specifically, the proposed 3CAD
includes eight different types of manufactured parts, totaling 27,039 high-
resolution images labeled with pixel-level anomalies. The key features of 3CAD
are that it covers anomalous regions of different sizes, multiple anomaly
types, and the possibility of multiple anomalous regions and multiple anomaly
types per anomaly image. This is the largest and first anomaly de- tection
dataset dedicated to 3C product quality control for community exploration and
development. Meanwhile, we in- troduce a simple yet effective framework for
unsupervised anomaly detection: a Coarse-to-Fine detection paradigm with
Recovery Guidance (CFRG). To detect small defect anoma- lies, the proposed CFRG
utilizes a coarse-to-fine detection paradigm. Specifically, we utilize a
heterogeneous distilla- tion model for coarse localization and then fine
localiza- tion through a segmentation model. In addition, to better capture
normal patterns, we introduce recovery features as guidance. Finally, we report
the results of our CFRG frame- work and popular anomaly detection methods on
the 3CAD dataset, demonstrating strong competitiveness and providing a highly
challenging benchmark to promote the development of the anomaly detection
field. Data and code are available: https://github.com/EnquanYang2022/3CAD.Summary
AI-Generated Summary