Генерация на основе аномалий с использованием малого числа примеров для классификации и сегментации аномалий
Few-Shot Anomaly-Driven Generation for Anomaly Classification and Segmentation
May 14, 2025
Авторы: Guan Gui, Bin-Bin Gao, Jun Liu, Chengjie Wang, Yunsheng Wu
cs.AI
Аннотация
Обнаружение аномалий является практичной, но сложной задачей из-за редкости аномальных образцов в промышленной инспекции. Некоторые существующие методы обнаружения аномалий решают эту проблему путем синтеза аномалий с использованием шума или внешних данных. Однако между синтетическими и реальными аномалиями всегда существует значительный семантический разрыв, что приводит к слабой производительности в обнаружении аномалий. Для решения этой проблемы мы предлагаем метод генерации, управляемой аномалиями (AnoGen), который использует всего несколько реальных аномалий для генерации реалистичных и разнообразных аномалий с помощью диффузионной модели, что способствует обучению моделей обнаружения аномалий. Наша работа разделена на три этапа. На первом этапе мы изучаем распределение аномалий на основе нескольких предоставленных реальных аномалий и внедряем полученные знания в эмбеддинг. На втором этапе мы используем этот эмбеддинг и заданные ограничивающие рамки для управления диффузионной моделью с целью генерации реалистичных и разнообразных аномалий на конкретных объектах (или текстурах). На заключительном этапе мы предлагаем слабо контролируемый метод обнаружения аномалий для обучения более мощной модели с использованием сгенерированных аномалий. Наш метод основан на моделях DRAEM и DesTSeg и проводит эксперименты на широко используемом наборе данных для промышленного обнаружения аномалий, MVTec. Эксперименты показывают, что сгенерированные аномалии эффективно улучшают производительность модели как в задачах классификации, так и в задачах сегментации аномалий. Например, DRAEM и DesTSeg достигли улучшения на 5,8% и 1,5% соответственно по метрике AU-PR в задаче сегментации. Код и сгенерированные аномальные данные доступны по адресу https://github.com/gaobb/AnoGen.
English
Anomaly detection is a practical and challenging task due to the scarcity of
anomaly samples in industrial inspection. Some existing anomaly detection
methods address this issue by synthesizing anomalies with noise or external
data. However, there is always a large semantic gap between synthetic and
real-world anomalies, resulting in weak performance in anomaly detection. To
solve the problem, we propose a few-shot Anomaly-driven Generation (AnoGen)
method, which guides the diffusion model to generate realistic and diverse
anomalies with only a few real anomalies, thereby benefiting training anomaly
detection models. Specifically, our work is divided into three stages. In the
first stage, we learn the anomaly distribution based on a few given real
anomalies and inject the learned knowledge into an embedding. In the second
stage, we use the embedding and given bounding boxes to guide the diffusion
model to generate realistic and diverse anomalies on specific objects (or
textures). In the final stage, we propose a weakly-supervised anomaly detection
method to train a more powerful model with generated anomalies. Our method
builds upon DRAEM and DesTSeg as the foundation model and conducts experiments
on the commonly used industrial anomaly detection dataset, MVTec. The
experiments demonstrate that our generated anomalies effectively improve the
model performance of both anomaly classification and segmentation tasks
simultaneously, \eg, DRAEM and DseTSeg achieved a 5.8\% and 1.5\% improvement
in AU-PR metric on segmentation task, respectively. The code and generated
anomalous data are available at https://github.com/gaobb/AnoGen.Summary
AI-Generated Summary