概要: 赤外線小目標検出(IRSTD)手法は主にタスクをピクセルレベルのセグメンテーションとして定式化する。これには高コストの密なアノテーションが必要となり、弱いテクスチャと境界が曖昧な極小ターゲットには適していない。
この問題に対処するため、低コストの点監視とマスクレベル検出を橋渡しするフレームワーク Point-to-Mask を提案する。2つの構成要素を通じて: 点アノテーションをコンパクトなターゲットマスクと幾何的手掛かりへ変換する物理駆動型適応マスク生成(PAMG)モジュールと、時空間モーション手掛かりを用いてIRSTDをターゲット中心の位置推定と有効半径回帰として再定式化する軽量な Radius-aware Point Regression Network(RPR-Net)である。
この二つのモジュールは閉ループを形成する:訓練中、PAMG は疑似マスクと幾何的教師信号を生成し、推論時には RPR-Net の幾何的予測を PAMG にフィードバックしてピクセルレベルのマスク回復に用いる。
体系的評価を促進するため、注釈を洗練させた逐次データセット SIRSTD-Pixel をさらに構築した。
実験では、提案されたフレームワークは高品質な疑似ラベル、優れた検出精度、効率的な推論を達成し、点監視設定の下でアノテーションコストを大幅に抑えつつ完全監視性能に近づくことを示している。
コードとデータセットは以下で公開される予定です: https://github.com/GaoScience/point-to-mask.
Point-to-Mask: 任意の点注釈からマスクレベルの赤外小目標検出へ
arXiv cs.CV / 2026/3/18
📰 ニュースTools & Practical UsageModels & Research
要点
- 本論文は、低コストの点注釈監督とマスクレベルの赤外小目標検出を橋渡しするフレームワーク「Point-to-Mask」を提案し、PAMGとRPR-Netの2つのモジュールを用いる。
- PAMG は、点注釈をコンパクトなターゲットマスクと幾何的手掛かりに変換し、訓練用の疑似ラベルを生成する。
- RPR-Net は、時空間的モーション手掛かりを用いてターゲット中心を局在化し、実効半径を回帰して、IRSTD を中心定位と半径回帰として再定義する。
- これらのモジュールは閉ループで動作する。PAMG の疑似マスクが訓練をガイドし、推論時には RPR-Net の幾何学的予測がマスクを改善する。
- 新しいデータセット SIRSTD-Pixel がピクセルレベルの評価のために導入され、提案手法ははるかに低いアノテーションコストでほぼ完全監視に近い性能を達成する。コードとデータは公開予定。
