赤外線小目標検出におけるスケール損失関数とガウス形状畳み込みの再検討

arXiv cs.CV / 2026/4/14

💬 オピニオンIdeas & Deep AnalysisModels & Research

共有:

要点

本論文は、単調性を満たさないスケール損失関数が引き起こす学習の不安定性に関連した赤外線小目標検出の課題に取り組み、厳密に単調な勾配を持つdiffベースのスケール損失を提案し、安定した収束を実現する。
複数のスケール損失バリアントを分析し、その幾何学的・勾配的な性質が検出挙動および性能にどのように影響するかを説明する。
空間的な注意を改善するために、著者らは、赤外線小目標の中心集中型の強度プロファイルによりよく適合する、学習可能なスケールパラメータを備えたガウス形状の畳み込みを導入する。
さらに、回転したピンホイール（羽根車）マスクによってカーネルアラインメントを強化し、ストレートスルー推定器を用いて畳み込みの向きを適応的に決定する。
IRSTD-1k、NUDT-SIRST、SIRST-UAVBに関する実験により、最先端手法に対してmIoU、P_d、F_aのいずれでも一貫した改善が示され、匿名化されたコードおよび事前学習済みモデルが公開される。

要旨: 赤外線の微小ターゲット検出はいまだに2つの持続的な課題に直面しています。1つ目は、非単調なスケール損失関数による学習の不安定性です。2つ目は、小型ターゲットの物理的な撮像特性を無視する汎用畳み込みカーネルによる、空間的注意の不十分さです。本論文では、これら両方の側面を改めて検討します。損失側では、予測マスクと教師（グラウンドトゥルース）の符号付き面積差に基づいて予測に重みを与える \\emph{差分ベースのスケール損失} を提案し、厳密に単調な勾配と安定した収束を実現します。さらに、検出挙動に対する幾何学的性質の影響を理解するために、4種類のスケール損失バリアントのファミリーを解析します。空間側では、赤外線の微小ターゲットが持つ中心に集中した強度プロファイルに合わせるため、学習可能なスケールパラメータを備えた \\emph{ガウス形状の畳み込み} を導入します。加えて、ストレートスルー推定器によりカーネルをターゲットの向きへ適応的に整合させる \\emph{回転ピンホイールマスク} を付加します。IRSTD-1k、NUDT-SIRST、SIRST-UAVB に対する大規模な実験により、最先端手法に対して $mIoU$ 、 $P_d$ 、 $F_a$ が一貫して改善されることを示します。匿名化したコードおよび事前学習済みモデルを公開します。