単一ポイント教師あり赤外線小目標検出におけるエンドツーエンド特徴アフィニティ伝搬の限界の探究

arXiv cs.CV / 2026/5/4

📰 ニュースIdeas & Deep AnalysisModels & Research

要点

  • 本論文は、単一ポイント教師あり赤外線小目標検出に対し、in-batchかつ点アンカー付きの特徴アフィニティ伝搬によってポイントからマスクへの教師信号をオンライン生成する最小限の手法(GSACP)を研究し、オフラインの疑似ラベル生成ループを回避することを示しています。
  • 著者らは、このエンドツーエンド設計における最適化上のボトルネックとして、アフィニティ目標が学習中の同一特徴表現から生成されるため、学習が自己参照的なループになり得て、境界を鮮明化する一方で特徴空間を歪める可能性がある点を指摘し、「Self-Referential Propagation Drift」として理論化しています。
  • 障害モードを体系的に切り分けるために、ローカルEMA教師のデカップリング、ハード背景のコントラスト分離、適応的サポート幾何の調整を含むプロトコル化されたアブレーション手順を提案しています。
  • SIRST3データセットで、GSACP-Finalは新たな「超低誤報(false alarm)」運用領域を達成し、mIoU 0.6674と、PALに比べて誤検出アーティファクト(Fa)を相対的に38%削減する結果を示しました。
  • 本研究は、in-batch特徴伝搬のエンドツーエンド方式における性能の境界を整理し、誤報抑制が重要なデプロイ環境に適したコンパクトな代替手法であると主張しています。

Abstract

単一点の教師付き赤外線小目標検出(IRSTD)は、密なアノテーションのコストを大幅に削減します。現在の最先端(SOTA)手法は、多段階のアクティブ・ラーニングや物理駆動によるマスク生成といった明示的でオフラインの擬似ラベル構築により、マスク教師信号を復元して高い精度を達成しています。本論文では、よりミニマリストな代替案を検討します。それは、バッチ内の点アンカー付き特徴親和性伝播によって、点からマスクへの教師信号をオンライン生成する方法です。私たちは、このパラダイムをGSACPとして具体化します。GSACPは、ローカルな画像事前知識によってゲートされたハードマージンの特徴親和性を用いて検出器を直接教師し、外部のラベル進化ループを完全に排除するエンドツーエンドのテストベッドです。 しかし、このコンパクトな設計は最適化上のボトルネックを露呈させます。親和性のターゲットが、最適化されるのと同じ特徴表現から生成されるため、学習は自己参照的なループを形成します。私たちはこれを理論的に\emph{Self-Referential Propagation Drift(自己参照的伝播ドリフト)}として形式化します。これは、表現と教師信号の絡み合いによって、真の境界をより鋭くすることもあれば、自己のターゲットを満たすために特徴空間を歪めることも起こり得る現象です。これらの失敗モードを体系的に切り分けるために、ローカルEMA教師のデカップリング、ハード背景のコントラスティブ分離、適応的なサポート幾何という3つの要素にまたがる、手続き化された単一変数アブレーション手順を適用します。 SIRST3データセット上で、GSACP-Finalは新しい超低誤報(false-alarm)動作領域を確立し、PALと比較して誤報アーティファクト(\mathrm{Fa})が相対的に38\%減少することを示しつつ、高い競争力を持つ0.6674 mIoUを達成します。エンドツーエンドのパラダイムを体系的に分解することで、その性能限界をマッピングし、バッチ内特徴伝播が、誤報の抑制が最優先となる導入シナリオに対するコンパクトな代替策を提供できることを示します。