AI Navigate

AdapTS: マルチクラスおよび継続的視覚異常検知のための軽量な教師-生徒アプローチ

arXiv cs.CV / 2026/3/19

💬 オピニオンTools & Practical UsageModels & Research

要点

  • AdapTSは、エッジ展開に適したまま、マルチクラスおよび継続的視覚異常検知の両方を扱う統一的な教師-生徒アーキテクチャを提案します。
  • 1つの共有された凍結済みバックボーンを用い、学生側の経路に軽量アダプターを組み込むことで、2つの別個のアーキテクチャを必要としなくなります。
  • 学習には、セグメンテーション指向の目的関数と合成Perlinノイズ、さらに推論時に約99%の精度でアダプターを動的に選択するプロトタイプベースのタスク識別メカニズムを組み込んでいます。
  • MVTec ADおよびVisAの実験結果は、既存のTS法と同等の性能を維持しつつ、メモリオーバーヘッドを劇的に削減します。AdapTS-Sは追加メモリ8 MBのみを使用し(STFPM、RD4AD、およびDeSTSegよりも大幅に低い)。
  • 本研究は産業用エッジ環境へのスケーラビリティを実証し、実世界の検査現場におけるコストと導入の潜在的な利点を強調しています。

概要: 視覚的異常検知(VAD)は産業検査において極めて重要ですが、現在のほとんどの手法は単一カテゴリのシナリオに限定され、実世界の環境が求めるマルチクラスおよび継続的学習の要件に対処できていません。教師-学生(TS)アーキテクチャは効率的ですが、継続的設定ではまだ十分に検討されていません。このギャップを埋めるべく、マルチクラスおよび継続設定に対応した統一TSフレームワーク AdapTS を提案します。エッジデプロイメントに最適化されています。AdapTS は、共有された凍結済みのバックボーンを1つ用い、学生側の経路に軽量な学習可能アダプタを注入することで、2種類の異なるアーキテクチャを必要としないようにします。トレーニングは、セグメンテーションを指針とした目的関数と合成 Perlin ノイズによって向上します。一方、プロトタイプベースのタスク識別機構が推論時にアダプタを動的に選択し、精度は99%を達成します。
MVTec AD および VisA に対する実験は、AdapTS がマルチクラスおよび継続学習シナリオにおいて既存の TS 手法の性能に匹敵することを示すとともに、メモリオーバーヘッドを大幅に削減します。我々の最も軽量なバリアント AdapTS-S は、追加メモリがわずか 8 MB で、STFPM(95 MB)より 13 倍、RD4AD(360 MB)より 48 倍、DeSTSeg(1120 MB)より 149 倍少なく、複雑な産業環境におけるエッジデプロイメントに高度にスケーラブルなソリューションとなります。