概要: 工業検査システムは前例のない欠陥を認識できるはずですが、既存のほとんどの手法はクローズドセット(閉集合)の仮定のもとで動作しているため、新規の異常を検出できません。視覚プロンプティングは工業検査のためのスケーラブルな代替手段を提供しますが、既存手法は高いクラス内分散とわずかなクラス間差異により、プロンプト埋め込みの崩壊(prompt embedding collapse)に悩まされることが多いです。これを解決するために、我々はUniSpectorを提案します。UniSpectorは、素朴なプロンプト対領域のマッチングから、意味的に構造化された、かつ転移可能なプロンプトトポロジの原理に基づく設計へと焦点を移します。UniSpectorはSpatial-Spectral Prompt Encoderを用いて、向き不変で微細な表現を抽出します。これらは、Contrastive Prompt Encoderがプロンプト空間を意味的に整理された角度のマニフォールドへ明示的に正則化するための堅固な基盤となります。さらに、Prompt-guided Query Selectionは、プロンプトに整合する適応的なオブジェクトクエリを生成します。我々は、視覚プロンプトに基づくオープンセット欠陥ローカライゼーションのための初めてのベンチマークであるInspect Anythingを導入し、そこでUniSpectorがベースラインをAP50bで少なくとも19.7%、AP50mで15.8%上回ることを示します。これらの結果は、提案手法が、継続的に進化する工業環境に対して、再学習不要でスケーラブルな検査パラダイムを実現できることを示すと同時に、汎用的な視覚プロンプティングの設計に関する重要な洞察を提供するものです。
UniSpector:スペクトルコントラストによる視覚プロンプトで実現するユニバーサル・オープンセット欠陥認識
arXiv cs.CV / 2026/4/6
📰 ニュースSignals & Early TrendsIdeas & Deep AnalysisModels & Research
要点
- 本論文は、産業検査システムには、未だ見たことのない異常を検出するためのオープンセット欠陥認識が必要だと論じている。というのも、現在の多くの手法は欠陥のクローズドセットを前提としているからである。
- 提案手法のUniSpectorは、意味的に構造化され転移可能なプロンプトトポロジを構築することで、プロンプト埋め込みの崩壊(collapse)を回避することを目的とした視覚プロンプトの枠組みである。
- UniSpectorは、方位不変かつきめ細かな表現を実現するSpatial-Spectral Prompt Encoderと、意味的に整理された角度マニフォールド上にプロンプトを正則化するContrastive Prompt Encoderを導入する。
- 本手法では、Prompt-guided Query Selectionにより、プロンプトに整合する適応的なオブジェクトクエリを生成し、欠陥のローカライズ性能の向上を狙う。
- 著者らは、視覚プロンプトに基づくオープンセット欠陥ローカライズのための初のベンチマークであるInspect Anythingを提示しており、UniSpectorはベースラインに対して少なくとも19.7%(AP50b)および15.8%(AP50m)の改善を達成する。さらに、環境の変化に応じた再学習なしの検査パラダイムを支える。



