Génération pilotée par anomalies en apprentissage peu supervisé pour la classification et la segmentation d'anomalies
Few-Shot Anomaly-Driven Generation for Anomaly Classification and Segmentation
May 14, 2025
Auteurs: Guan Gui, Bin-Bin Gao, Jun Liu, Chengjie Wang, Yunsheng Wu
cs.AI
Résumé
La détection d'anomalies est une tâche pratique et complexe en raison de la rareté des échantillons d'anomalies dans l'inspection industrielle. Certaines méthodes existantes de détection d'anomalies abordent ce problème en synthétisant des anomalies avec du bruit ou des données externes. Cependant, il existe toujours un écart sémantique important entre les anomalies synthétiques et celles du monde réel, ce qui entraîne une performance médiocre en détection d'anomalies. Pour résoudre ce problème, nous proposons une méthode de génération pilotée par les anomalies (AnoGen) en few-shot, qui guide le modèle de diffusion pour générer des anomalies réalistes et diversifiées avec seulement quelques anomalies réelles, améliorant ainsi l'entraînement des modèles de détection d'anomalies. Plus précisément, notre travail est divisé en trois étapes. Dans la première étape, nous apprenons la distribution des anomalies à partir de quelques anomalies réelles données et injectons les connaissances acquises dans un embedding. Dans la deuxième étape, nous utilisons cet embedding et des boîtes englobantes données pour guider le modèle de diffusion afin de générer des anomalies réalistes et diversifiées sur des objets (ou textures) spécifiques. Dans la dernière étape, nous proposons une méthode de détection d'anomalies faiblement supervisée pour entraîner un modèle plus performant avec les anomalies générées. Notre méthode s'appuie sur DRAEM et DesTSeg comme modèle de base et réalise des expériences sur le jeu de données couramment utilisé pour la détection d'anomalies industrielles, MVTec. Les expériences montrent que nos anomalies générées améliorent efficacement les performances du modèle à la fois pour les tâches de classification et de segmentation des anomalies, par exemple, DRAEM et DesTSeg ont respectivement obtenu une amélioration de 5,8 % et 1,5 % sur la métrique AU-PR pour la tâche de segmentation. Le code et les données anormales générées sont disponibles à l'adresse https://github.com/gaobb/AnoGen.
English
Anomaly detection is a practical and challenging task due to the scarcity of
anomaly samples in industrial inspection. Some existing anomaly detection
methods address this issue by synthesizing anomalies with noise or external
data. However, there is always a large semantic gap between synthetic and
real-world anomalies, resulting in weak performance in anomaly detection. To
solve the problem, we propose a few-shot Anomaly-driven Generation (AnoGen)
method, which guides the diffusion model to generate realistic and diverse
anomalies with only a few real anomalies, thereby benefiting training anomaly
detection models. Specifically, our work is divided into three stages. In the
first stage, we learn the anomaly distribution based on a few given real
anomalies and inject the learned knowledge into an embedding. In the second
stage, we use the embedding and given bounding boxes to guide the diffusion
model to generate realistic and diverse anomalies on specific objects (or
textures). In the final stage, we propose a weakly-supervised anomaly detection
method to train a more powerful model with generated anomalies. Our method
builds upon DRAEM and DesTSeg as the foundation model and conducts experiments
on the commonly used industrial anomaly detection dataset, MVTec. The
experiments demonstrate that our generated anomalies effectively improve the
model performance of both anomaly classification and segmentation tasks
simultaneously, \eg, DRAEM and DseTSeg achieved a 5.8\% and 1.5\% improvement
in AU-PR metric on segmentation task, respectively. The code and generated
anomalous data are available at https://github.com/gaobb/AnoGen.Summary
AI-Generated Summary