Few-Shot Anomalie-gesteuerte Generierung für Anomalie-Klassifikation und Segmentierung
Few-Shot Anomaly-Driven Generation for Anomaly Classification and Segmentation
May 14, 2025
Autoren: Guan Gui, Bin-Bin Gao, Jun Liu, Chengjie Wang, Yunsheng Wu
cs.AI
Zusammenfassung
Die Anomalieerkennung ist eine praktische und herausfordernde Aufgabe aufgrund der Knappheit von Anomalieproben in der industriellen Inspektion. Einige bestehende Methoden zur Anomalieerkennung adressieren dieses Problem, indem sie Anomalien durch Rauschen oder externe Daten synthetisieren. Es besteht jedoch immer eine große semantische Lücke zwischen synthetischen und realen Anomalien, was zu einer schwachen Leistung bei der Anomalieerkennung führt. Um dieses Problem zu lösen, schlagen wir eine Few-Shot Anomalie-getriebene Generierungsmethode (AnoGen) vor, die das Diffusionsmodell anleitet, realistische und vielfältige Anomalien mit nur wenigen realen Anomalien zu erzeugen, wodurch das Training von Anomalieerkennungsmodellen verbessert wird. Konkret gliedert sich unsere Arbeit in drei Phasen. In der ersten Phase lernen wir die Anomalieverteilung basierend auf einigen gegebenen realen Anomalien und injizieren das gelernte Wissen in ein Embedding. In der zweiten Phase verwenden wir das Embedding und gegebene Bounding Boxes, um das Diffusionsmodell anzuleiten, realistische und vielfältige Anomalien auf spezifischen Objekten (oder Texturen) zu erzeugen. In der letzten Phase schlagen wir eine schwach überwachte Anomalieerkennungsmethode vor, um ein leistungsfähigeres Modell mit den generierten Anomalien zu trainieren. Unsere Methode baut auf DRAEM und DesTSeg als Basismodell auf und führt Experimente auf dem häufig verwendeten industriellen Anomalieerkennungsdatensatz MVTec durch. Die Experimente zeigen, dass unsere generierten Anomalien die Modellleistung sowohl bei der Anomalieklassifikation als auch bei der Segmentierungsaufgabe effektiv verbessern, z.B. erreichten DRAEM und DseTSeg eine Verbesserung von 5,8 % bzw. 1,5 % im AU-PR-Metrik bei der Segmentierungsaufgabe. Der Code und die generierten anomalen Daten sind unter https://github.com/gaobb/AnoGen verfügbar.
English
Anomaly detection is a practical and challenging task due to the scarcity of
anomaly samples in industrial inspection. Some existing anomaly detection
methods address this issue by synthesizing anomalies with noise or external
data. However, there is always a large semantic gap between synthetic and
real-world anomalies, resulting in weak performance in anomaly detection. To
solve the problem, we propose a few-shot Anomaly-driven Generation (AnoGen)
method, which guides the diffusion model to generate realistic and diverse
anomalies with only a few real anomalies, thereby benefiting training anomaly
detection models. Specifically, our work is divided into three stages. In the
first stage, we learn the anomaly distribution based on a few given real
anomalies and inject the learned knowledge into an embedding. In the second
stage, we use the embedding and given bounding boxes to guide the diffusion
model to generate realistic and diverse anomalies on specific objects (or
textures). In the final stage, we propose a weakly-supervised anomaly detection
method to train a more powerful model with generated anomalies. Our method
builds upon DRAEM and DesTSeg as the foundation model and conducts experiments
on the commonly used industrial anomaly detection dataset, MVTec. The
experiments demonstrate that our generated anomalies effectively improve the
model performance of both anomaly classification and segmentation tasks
simultaneously, \eg, DRAEM and DseTSeg achieved a 5.8\% and 1.5\% improvement
in AU-PR metric on segmentation task, respectively. The code and generated
anomalous data are available at https://github.com/gaobb/AnoGen.