IRSTDを再考する:単一点スーパービジョンで導くエンコーダのみのフレームワークで赤外線小目標検出は十分
arXiv cs.CV / 2026/4/8
📰 ニュースSignals & Early TrendsIdeas & Deep AnalysisModels & Research
要点
- 本論文は、赤外線小目標検出(IRSTD)では、ピクセルレベルのエンコーダ–デコーダによるセグメンテーションよりも目標の局在化を重視すべきだと主張する。なぜなら、目標は数ピクセル程度であり、クラッタにより境界がぼやけがちだからである。
- IRSTDを重心回帰問題として再定式化し、エンコーダのみのエンドツーエンド処理パイプラインで動作することを目的とした、Single-Point Supervision guided Infrared Probabilistic Response Encoding(SPIRE)を提案する。
- SPIREは、Point-Response Prior Supervision(PRPS)を用いて、単一点ラベルを確率的レスポンスマップへ変換し、赤外線の点状目標の特性により適合させる。
- 高解像度の確率的エンコーダ(HRPE)を提案し、デコーダによる再構成を行わずに出力を直接回帰することで、疎な目標分布下での最適化不安定性の低減を狙う。
- SIRST-UAVBやSIRST4といったベンチマークでの実験により、低い誤警報率を維持しつつ目標レベルで競争力のある検出性能が示され、さらに計算コストも大幅に低いことが確認され、コードは公開されている。


