Geração Orientada por Anomalias com Poucos Exemplos para Classificação e Segmentação de Anomalias
Few-Shot Anomaly-Driven Generation for Anomaly Classification and Segmentation
May 14, 2025
Autores: Guan Gui, Bin-Bin Gao, Jun Liu, Chengjie Wang, Yunsheng Wu
cs.AI
Resumo
A detecção de anomalias é uma tarefa prática e desafiadora devido à escassez de amostras anômalas em inspeções industriais. Alguns métodos existentes de detecção de anomalias abordam essa questão sintetizando anomalias com ruído ou dados externos. No entanto, sempre há uma grande lacuna semântica entre anomalias sintéticas e as do mundo real, resultando em um desempenho fraco na detecção de anomalias. Para resolver esse problema, propomos um método de Geração Orientada por Anomalias em Poucos Exemplos (AnoGen), que orienta o modelo de difusão a gerar anomalias realistas e diversas com apenas algumas anomalias reais, beneficiando assim o treinamento de modelos de detecção de anomalias. Especificamente, nosso trabalho é dividido em três etapas. Na primeira etapa, aprendemos a distribuição das anomalias com base em algumas anomalias reais fornecidas e injetamos o conhecimento aprendido em um embedding. Na segunda etapa, usamos o embedding e caixas delimitadoras fornecidas para orientar o modelo de difusão a gerar anomalias realistas e diversas em objetos (ou texturas) específicos. Na etapa final, propomos um método de detecção de anomalias fracamente supervisionado para treinar um modelo mais robusto com as anomalias geradas. Nosso método é baseado em DRAEM e DesTSeg como modelo de fundo e realiza experimentos no conjunto de dados de detecção de anomalias industriais comumente utilizado, MVTec. Os experimentos demonstram que nossas anomalias geradas melhoram efetivamente o desempenho do modelo tanto em tarefas de classificação quanto de segmentação de anomalias simultaneamente, por exemplo, DRAEM e DesTSeg alcançaram uma melhoria de 5,8% e 1,5% na métrica AU-PR na tarefa de segmentação, respectivamente. O código e os dados anômalos gerados estão disponíveis em https://github.com/gaobb/AnoGen.
English
Anomaly detection is a practical and challenging task due to the scarcity of
anomaly samples in industrial inspection. Some existing anomaly detection
methods address this issue by synthesizing anomalies with noise or external
data. However, there is always a large semantic gap between synthetic and
real-world anomalies, resulting in weak performance in anomaly detection. To
solve the problem, we propose a few-shot Anomaly-driven Generation (AnoGen)
method, which guides the diffusion model to generate realistic and diverse
anomalies with only a few real anomalies, thereby benefiting training anomaly
detection models. Specifically, our work is divided into three stages. In the
first stage, we learn the anomaly distribution based on a few given real
anomalies and inject the learned knowledge into an embedding. In the second
stage, we use the embedding and given bounding boxes to guide the diffusion
model to generate realistic and diverse anomalies on specific objects (or
textures). In the final stage, we propose a weakly-supervised anomaly detection
method to train a more powerful model with generated anomalies. Our method
builds upon DRAEM and DesTSeg as the foundation model and conducts experiments
on the commonly used industrial anomaly detection dataset, MVTec. The
experiments demonstrate that our generated anomalies effectively improve the
model performance of both anomaly classification and segmentation tasks
simultaneously, \eg, DRAEM and DseTSeg achieved a 5.8\% and 1.5\% improvement
in AU-PR metric on segmentation task, respectively. The code and generated
anomalous data are available at https://github.com/gaobb/AnoGen.