Generación Impulsada por Anomalías con Pocos Ejemplos para Clasificación y Segmentación de Anomalías
Few-Shot Anomaly-Driven Generation for Anomaly Classification and Segmentation
May 14, 2025
Autores: Guan Gui, Bin-Bin Gao, Jun Liu, Chengjie Wang, Yunsheng Wu
cs.AI
Resumen
La detección de anomalías es una tarea práctica y desafiante debido a la escasez de muestras anómalas en la inspección industrial. Algunos métodos existentes de detección de anomalías abordan este problema sintetizando anomalías con ruido o datos externos. Sin embargo, siempre existe una gran brecha semántica entre las anomalías sintéticas y las del mundo real, lo que resulta en un rendimiento débil en la detección de anomalías. Para resolver este problema, proponemos un método de Generación Impulsada por Anomalías (AnoGen) con pocas muestras, que guía al modelo de difusión para generar anomalías realistas y diversas con solo unas pocas anomalías reales, beneficiando así el entrenamiento de modelos de detección de anomalías. Específicamente, nuestro trabajo se divide en tres etapas. En la primera etapa, aprendemos la distribución de anomalías basándonos en unas pocas anomalías reales dadas e inyectamos el conocimiento aprendido en un embedding. En la segunda etapa, utilizamos el embedding y las cajas delimitadoras dadas para guiar al modelo de difusión a generar anomalías realistas y diversas en objetos (o texturas) específicos. En la etapa final, proponemos un método de detección de anomalías débilmente supervisado para entrenar un modelo más potente con las anomalías generadas. Nuestro método se basa en DRAEM y DesTSeg como modelo base y realiza experimentos en el conjunto de datos de detección de anomalías industriales comúnmente utilizado, MVTec. Los experimentos demuestran que nuestras anomalías generadas mejoran efectivamente el rendimiento del modelo tanto en tareas de clasificación como de segmentación de anomalías simultáneamente, por ejemplo, DRAEM y DesTSeg lograron una mejora del 5.8% y 1.5% en la métrica AU-PR en la tarea de segmentación, respectivamente. El código y los datos anómalos generados están disponibles en https://github.com/gaobb/AnoGen.
English
Anomaly detection is a practical and challenging task due to the scarcity of
anomaly samples in industrial inspection. Some existing anomaly detection
methods address this issue by synthesizing anomalies with noise or external
data. However, there is always a large semantic gap between synthetic and
real-world anomalies, resulting in weak performance in anomaly detection. To
solve the problem, we propose a few-shot Anomaly-driven Generation (AnoGen)
method, which guides the diffusion model to generate realistic and diverse
anomalies with only a few real anomalies, thereby benefiting training anomaly
detection models. Specifically, our work is divided into three stages. In the
first stage, we learn the anomaly distribution based on a few given real
anomalies and inject the learned knowledge into an embedding. In the second
stage, we use the embedding and given bounding boxes to guide the diffusion
model to generate realistic and diverse anomalies on specific objects (or
textures). In the final stage, we propose a weakly-supervised anomaly detection
method to train a more powerful model with generated anomalies. Our method
builds upon DRAEM and DesTSeg as the foundation model and conducts experiments
on the commonly used industrial anomaly detection dataset, MVTec. The
experiments demonstrate that our generated anomalies effectively improve the
model performance of both anomaly classification and segmentation tasks
simultaneously, \eg, DRAEM and DseTSeg achieved a 5.8\% and 1.5\% improvement
in AU-PR metric on segmentation task, respectively. The code and generated
anomalous data are available at https://github.com/gaobb/AnoGen.Summary
AI-Generated Summary