SGANet:マルチモーダル・マルチビュー異常検出のための意味的および幾何学的アラインメント

arXiv cs.CV / 2026/4/8

📰 ニュースIdeas & Deep AnalysisModels & Research

要点

  • 本論文は、視点の変化に伴う特徴の不一致と、モダリティ間の不一致に対処する、マルチモーダル・マルチビュー異常検出のための統一フレームワークであるSGANetを提案する。
  • SGANetは3つの構成要素—選択的なクロスビュー特徴の洗練を行うSCFRM、モダリティ間で意味的および構造的なパッチを整列するSSPA、視点間で幾何学的アラインメントを行うMVGA—を組み合わせる。
  • クロスビューの特徴相互作用と、意味・構造の一貫性、さらにグローバルな幾何学的一致を共同でモデル化することで、SGANetはより物理的に整合した表現を学習する。
  • SiM3DおよびEyecandiesのデータセットでの実験により、異常検出および局在化の両方で最先端の結果が示され、産業用の欠陥検査への応用可能性も報告されている。