AI Navigate

産業用コイルばね検査のためのクロススケール特徴融合を備えた変形可能アテンションベースの検出トランスフォーマー

arXiv cs.CV / 2026/3/17

📰 ニュースModels & Research

要点

  • MSD-DETRは、学習時のマルチブランチトポロジーを推論時の効率性と切り離す構造再パラメータ化戦略を導入し、リアルタイム性能を維持しつつ特徴抽出を向上させる。
  • それは、形態の多様性とスケール変動にもかかわらず、欠陥関連領域に焦点を当てるためのコンテンツ適応型の空間サンプリングを可能にする変形可能アテンション機構を採用している。
  • この手法は、GSConvモジュールとVoVGSCSPブロックを用いたクロススケール特徴融合により、効果的な多解像度情報の統合を実現する。
  • 実世界の機関車用コイルばねデータセットにおいて、MSD-DETRは98 FPSで92.4%のmAP@0.5を達成し、YOLOv8およびRT-DETRを上回り、速度をほぼ同等に維持して産業用コイルばね検査の新たなベンチマークを樹立する。

概要: 機関車用コイルスプリングの自動視覚検査は、表面欠陥の形態多様性、著しいスケール変動、そして複雑な産業背景のため、重大な課題を呈します。 本論文は MSD-DETR(Multi-Scale Deformable Detection Transformer)と呼ばれる新規検出フレームワークを提案します。3つの主要な革新を通じてこれらの課題に対処します: (1) 訓練時の多分岐トポロジーを推論時の効率性からデカップリングする構造再パラメータ化戦略。これによりリアルタイム性能を維持しつつ特徴抽出を強化します; (2) 可変形アテンション機構は、形態的不規則性に関係なく欠陥関連領域に動的に焦点を合わせる、コンテンツ適応的な空間サンプリングを可能にします; (3) GSConvモジュールと VoVGSCSP ブロックを組み込んだクロススケール特徴融合アーキテクチャで、効果的な多解像度情報の統合を実現します。実世界の機関車用コイルスプリングデータセットを用いた包括的な実験により、MSD-DETR は 92.4% mAP@0.5 を 98 FPS で達成し、YOLOv8(+3.1% mAP)およびベースライン RT-DETR(+2.8% mAP)を含む最先端検出器を上回り、推論速度を同等に維持しつつ、産業用コイルスプリング品質検査の新たなベンチマークを確立したことを示します。