3CAD: Большой набор данных реального мира продуктов 3C для надзора за аномалиями без учителя
3CAD: A Large-Scale Real-World 3C Product Dataset for Unsupervised Anomaly
February 9, 2025
Авторы: Enquan Yang, Peng Xing, Hanyang Sun, Wenbo Guo, Yuanwei Ma, Zechao Li, Dan Zeng
cs.AI
Аннотация
Промышленное обнаружение аномалий достигает прогресса благодаря наборам данных, таким как MVTec-AD и VisA. Однако они сталкиваются с ограничениями в виде количества образцов дефектов, типов дефектов и доступности реальных сцен. Эти ограничения препятствуют исследователям дальнейшего изучения производительности промышленного обнаружения с более высокой точностью. В этой связи мы предлагаем новый масштабный набор данных для обнаружения аномалий под названием 3CAD, который происходит из реальных производственных линий 3C. В частности, предложенный 3CAD включает в себя восемь различных типов изготовленных деталей, общим числом 27 039 изображений высокого разрешения, помеченных аномалиями на уровне пикселей. Основные особенности 3CAD заключаются в том, что он охватывает аномальные области различных размеров, несколько типов аномалий, а также возможность наличия нескольких аномальных областей и нескольких типов аномалий на одном аномальном изображении. Это самый крупный и первый набор данных для обнаружения аномалий, посвященный контролю качества продукции 3C для исследований и разработок в сообществе. Тем временем мы представляем простую, но эффективную структуру для неконтролируемого обнаружения аномалий: парадигму обнаружения от грубого к точному с руководством восстановления (CFRG). Для обнаружения маленьких дефектных аномалий предложенный CFRG использует парадигму обнаружения от грубого к точному. Конкретно, мы используем гетерогенную модель дистилляции для грубой локализации, а затем точную локализацию через модель сегментации. Кроме того, для лучшего захвата нормальных паттернов мы вводим признаки восстановления в качестве руководства. Наконец, мы представляем результаты нашей структуры CFRG и популярных методов обнаружения аномалий на наборе данных 3CAD, демонстрируя сильную конкурентоспособность и предоставляя высоко вызывающий бенчмарк для поощрения развития области обнаружения аномалий. Данные и код доступны по ссылке: https://github.com/EnquanYang2022/3CAD.
English
Industrial anomaly detection achieves progress thanks to datasets such as
MVTec-AD and VisA. However, they suf- fer from limitations in terms of the
number of defect sam- ples, types of defects, and availability of real-world
scenes. These constraints inhibit researchers from further exploring the
performance of industrial detection with higher accuracy. To this end, we
propose a new large-scale anomaly detection dataset called 3CAD, which is
derived from real 3C produc- tion lines. Specifically, the proposed 3CAD
includes eight different types of manufactured parts, totaling 27,039 high-
resolution images labeled with pixel-level anomalies. The key features of 3CAD
are that it covers anomalous regions of different sizes, multiple anomaly
types, and the possibility of multiple anomalous regions and multiple anomaly
types per anomaly image. This is the largest and first anomaly de- tection
dataset dedicated to 3C product quality control for community exploration and
development. Meanwhile, we in- troduce a simple yet effective framework for
unsupervised anomaly detection: a Coarse-to-Fine detection paradigm with
Recovery Guidance (CFRG). To detect small defect anoma- lies, the proposed CFRG
utilizes a coarse-to-fine detection paradigm. Specifically, we utilize a
heterogeneous distilla- tion model for coarse localization and then fine
localiza- tion through a segmentation model. In addition, to better capture
normal patterns, we introduce recovery features as guidance. Finally, we report
the results of our CFRG frame- work and popular anomaly detection methods on
the 3CAD dataset, demonstrating strong competitiveness and providing a highly
challenging benchmark to promote the development of the anomaly detection
field. Data and code are available: https://github.com/EnquanYang2022/3CAD.Summary
AI-Generated Summary