ChatPaper.aiChatPaper

正常画像1枚だけで多クラス異常を検出する学習 プロンプト

Learning to Detect Multi-class Anomalies with Just One Normal Image Prompt

May 14, 2025
著者: Bin-Bin Gao
cs.AI

要旨

自己注意機構を用いた教師なし再構成ネットワークは、単一モデルによる多クラス(統一)異常検出において最先端の性能を達成しています。しかし、これらの自己注意再構成モデルは主にターゲット特徴量を操作するため、文脈との高い一貫性により正常特徴と異常特徴の両方を完璧に再構成してしまい、異常検出に失敗する可能性があります。さらに、これらのモデルは低空間解像度の潜在空間で再構成を行うため、不正確な異常セグメンテーションを生成することが多いです。再構成モデルの効率性を維持しつつ、統一異常検出の汎化性能を向上させるために、我々は単一の正常画像プロンプト(OneNIP)を用いて正常特徴を再構成し、異常特徴を復元するシンプルかつ効果的な手法を提案します。従来の研究とは異なり、OneNIPは初めて単一の正常画像プロンプトだけで異常を再構成または復元することを可能にし、統一異常検出の性能を効果的に向上させます。さらに、実際の正常画像と合成された異常画像の両方を使用して再構成誤差を回帰する教師ありリファイナを提案し、ピクセルレベルの異常セグメンテーションを大幅に改善します。OneNIPは、MVTec、BTAD、VisAという3つの産業用異常検出ベンチマークにおいて、従来の手法を上回る性能を示しています。コードと事前学習済みモデルはhttps://github.com/gaobb/OneNIPで公開されています。
English
Unsupervised reconstruction networks using self-attention transformers have achieved state-of-the-art performance for multi-class (unified) anomaly detection with a single model. However, these self-attention reconstruction models primarily operate on target features, which may result in perfect reconstruction for both normal and anomaly features due to high consistency with context, leading to failure in detecting anomalies. Additionally, these models often produce inaccurate anomaly segmentation due to performing reconstruction in a low spatial resolution latent space. To enable reconstruction models enjoying high efficiency while enhancing their generalization for unified anomaly detection, we propose a simple yet effective method that reconstructs normal features and restores anomaly features with just One Normal Image Prompt (OneNIP). In contrast to previous work, OneNIP allows for the first time to reconstruct or restore anomalies with just one normal image prompt, effectively boosting unified anomaly detection performance. Furthermore, we propose a supervised refiner that regresses reconstruction errors by using both real normal and synthesized anomalous images, which significantly improves pixel-level anomaly segmentation. OneNIP outperforms previous methods on three industry anomaly detection benchmarks: MVTec, BTAD, and VisA. The code and pre-trained models are available at https://github.com/gaobb/OneNIP.

Summary

AI-Generated Summary

PDF42May 16, 2025