Генерация на основе аномалий с использованием малого числа примеров для классификации и сегментации аномалий

Аннотация

Обнаружение аномалий является практичной, но сложной задачей из-за редкости аномальных образцов в промышленной инспекции. Некоторые существующие методы обнаружения аномалий решают эту проблему путем синтеза аномалий с использованием шума или внешних данных. Однако между синтетическими и реальными аномалиями всегда существует значительный семантический разрыв, что приводит к слабой производительности в обнаружении аномалий. Для решения этой проблемы мы предлагаем метод генерации, управляемой аномалиями (AnoGen), который использует всего несколько реальных аномалий для генерации реалистичных и разнообразных аномалий с помощью диффузионной модели, что способствует обучению моделей обнаружения аномалий. Наша работа разделена на три этапа. На первом этапе мы изучаем распределение аномалий на основе нескольких предоставленных реальных аномалий и внедряем полученные знания в эмбеддинг. На втором этапе мы используем этот эмбеддинг и заданные ограничивающие рамки для управления диффузионной моделью с целью генерации реалистичных и разнообразных аномалий на конкретных объектах (или текстурах). На заключительном этапе мы предлагаем слабо контролируемый метод обнаружения аномалий для обучения более мощной модели с использованием сгенерированных аномалий. Наш метод основан на моделях DRAEM и DesTSeg и проводит эксперименты на широко используемом наборе данных для промышленного обнаружения аномалий, MVTec. Эксперименты показывают, что сгенерированные аномалии эффективно улучшают производительность модели как в задачах классификации, так и в задачах сегментации аномалий. Например, DRAEM и DesTSeg достигли улучшения на 5,8% и 1,5% соответственно по метрике AU-PR в задаче сегментации. Код и сгенерированные аномальные данные доступны по адресу https://github.com/gaobb/AnoGen.

English

Anomaly detection is a practical and challenging task due to the scarcity of anomaly samples in industrial inspection. Some existing anomaly detection methods address this issue by synthesizing anomalies with noise or external data. However, there is always a large semantic gap between synthetic and real-world anomalies, resulting in weak performance in anomaly detection. To solve the problem, we propose a few-shot Anomaly-driven Generation (AnoGen) method, which guides the diffusion model to generate realistic and diverse anomalies with only a few real anomalies, thereby benefiting training anomaly detection models. Specifically, our work is divided into three stages. In the first stage, we learn the anomaly distribution based on a few given real anomalies and inject the learned knowledge into an embedding. In the second stage, we use the embedding and given bounding boxes to guide the diffusion model to generate realistic and diverse anomalies on specific objects (or textures). In the final stage, we propose a weakly-supervised anomaly detection method to train a more powerful model with generated anomalies. Our method builds upon DRAEM and DesTSeg as the foundation model and conducts experiments on the commonly used industrial anomaly detection dataset, MVTec. The experiments demonstrate that our generated anomalies effectively improve the model performance of both anomaly classification and segmentation tasks simultaneously, \eg, DRAEM and DseTSeg achieved a 5.8\% and 1.5\% improvement in AU-PR metric on segmentation task, respectively. The code and generated anomalous data are available at https://github.com/gaobb/AnoGen.

Генерация на основе аномалий с использованием малого числа примеров для классификации и сегментации аномалий

Few-Shot Anomaly-Driven Generation for Anomaly Classification and Segmentation

Аннотация

Support