MS-SSE-Net:土木・地盤工学における構造物損傷検出のためのマルチスケール空間スクイーズ&エキサイトネットワーク

arXiv cs.CV / 2026/4/17

📰 ニュースModels & Research

要点

  • この論文は、損傷パターンや環境条件のばらつきがある中でも、構造物損傷を画像から分類するための深層学習モデル「MS-SSE-Net」を提案しています。
  • MS-SSE-NetはDenseNet201を土台に、平行な深さ方向畳み込みによるマルチスケール特徴抽出に加えて、スクイーズ&エキサイト型のチャネル注意と空間注意を組み合わせ、重要領域に焦点を当てつつノイズを抑制します。
  • 学習した特徴はグローバル平均プーリングと全結合層によって処理され、最終的な損傷予測が生成されます。
  • 複数カテゴリを含むStructDamageデータセットでの実験では、DenseNet201のベースラインおよび他の比較手法を上回り、精度・再現率・F1・正解率が概ね99.25〜99.31%と報告されています。
  • 全体として、マルチスケール表現と注意機構の組み合わせにより、損傷分類における精度と再現率のバランス、ならびに分類精度が向上することを示しています。

Abstract

構造物の損傷検出は、土木インフラの安全性と信頼性を維持するために不可欠です。しかし、損傷パターンや環境条件の違いにより、画像から異なる種類の構造物損傷を正確に特定することは依然として困難です。これらの課題に対処するため、本論文では構造物損傷の分類のための新しい深層学習(DL)フレームワークであるMS-SSE-Netを提案します。提案モデルはDenseNet201バックボーンを基盤としており、マルチスケール特徴抽出とチャネルおよび空間アテンション機構(MS-SSE-Net)を統合しています。具体的には、並列の深さ方向畳み込みにより局所的特徴と文脈的特徴の両方を捉えます。さらに、スクイーズ・アンド・エキサイト(SE)スタイルのチャネル注意および空間注意により、有益な領域を強調し、無関係なノイズを抑制します。洗練された特徴はその後、グローバル平均プーリングと全結合の分類層によって処理され、最終的な予測を生成します。実験は、複数の構造物損傷カテゴリを含むStructDamageデータセットで実施します。提案するMS-SSE-Netは、ベースラインのDenseNet201および他の比較手法と比べて優れた性能を示します。具体的には、提案手法は精度99.31%、再現率99.25%、F1スコア99.27%、正確度99.26%を達成し、精度98.62%、再現率98.53%、F1スコア98.58%、正確度98.53%であったベースラインモデルを上回ります。