要旨: 多クラスの欠陥検出は、既存の手法が典型的に次の2つの基本的な制約により困難に直面する、産業における品質検査で重要かつ挑戦的な課題である。(i) 欠陥カテゴリごとに個別のモデルを学習する必要があり、その結果として計算コストおよびメモリのオーバーヘッドが大きくなること、(ii) 異種の欠陥カテゴリを同時にモデル化する際にクラス間の特徴摂動が生じ、ロバスト性が低下すること、である。本論文では、FPFNetを提案する。これは、Feature Perturbation Pool(特徴摂動プール)に基づくFusion Networkであり、確率的な特徴摂動プールと多層特徴融合戦略を統合することで、これらの課題を統一された検出フレームワークの中で相乗的に解決する。特徴摂動プールは、抽出された特徴表現に対して、ガウスノイズ、F-Noise、F-Dropを含む多様なノイズパターンをランダムに注入することで、学習分布を豊かにし、それにより、ドメインシフトや未見の欠陥の形状に対するモデルのロバスト性を強化する。並行して、多層特徴融合モジュールは、エンコーダとデコーダの双方から階層的な特徴表現を、残差接続と正規化を通じて集約し、細かな空間的ディテールを保持しつつ、複雑なスケール間の関係を捉えることを可能にし、精密な欠陥位置特定に不可欠な情報を損なわないようにする。本手法はUniADアーキテクチャ~\cite{you2022unified}に基づいており、広く用いられている2つのベンチマークで最先端の性能を達成する。すなわち、MVTec-ADでは97.17%の画像レベルAUROCおよび96.93%のピクセルレベルAUROC、VisAでは91.08%の画像レベルAUROCおよび99.08%のピクセルレベルAUROCである。既存手法を顕著な差で上回りつつ、追加の学習可能パラメータや計算量の増加を導入しない。
統合型マルチクラス産業用欠陥検出のためのフィーチャー摂動プールに基づく融合ネットワーク
arXiv cs.CV / 2026/4/22
📰 ニュースIdeas & Deep AnalysisModels & Research
要点
- 本論文は、欠陥カテゴリごとに別々のネットワークを学習する必要を回避することを目的とした、統合型マルチクラス産業用欠陥検出モデルFPFNetを提案している。
- FPFNetは確率的なフィーチャー摂動プールを用いて、抽出した特徴表現にガウスノイズ、F-Noise、F-Dropといった多様なノイズパターンを注入し、ドメインシフトや未見の欠陥形状に対する頑健性を高める。
- 残差接続と正規化を伴うマルチレイヤー特徴融合モジュールによって、エンコーダとデコーダの階層的特徴を統合し、欠陥の正確な位置特定に必要なきめ細かな空間情報を保ちつつ、スケール間の複雑な関係を捉える。
- UniADアーキテクチャを土台にしつつ、MVTec-ADとVisAで画像レベル/ピクセルレベルAUROCの双方で最先端の性能を報告しており、追加の学習可能パラメータや計算量の増加を伴わない。
- 実験結果は、複数欠陥カテゴリを同時に扱う際に生じがちなクラス間の特徴摂動による性能劣化を、この手法が緩和できることを示唆している。


