Camo-M3FD:クロススペクトルのカモフラージュされた歩行者検出のための新しいベンチマークデータセット

arXiv cs.CV / 2026/4/21

📰 ニュースDeveloper Stack & InfrastructureSignals & Early TrendsModels & Research

要点

  • 本論文は、登録済みの可視–熱赤外(サーマル)画像ペアを用いた「Camo-M3FD」という、新しいクロススペクトルのカモフラージュ歩行者検出用ベンチマークデータセットを提案する。
  • 既存のカモフラージュ物体検出ベンチマークが非生物種に偏っている一方で、本研究は安全性が重要な人間検出という未開拓のギャップに取り組む。
  • データセットは定量的な指標に基づいて、前景と背景の類似度を高く保つように厳選されており、高品質なピクセルレベルのマスクも提供される。
  • 先進的なCODモデルに基づく標準化された評価フレームワークを提示し、熱のシグナルが位置特定に不可欠である一方、構造的ディテールの改善にはマルチスペクトル融合が重要だと示す。
  • Camo-M3FDはGitHubで公開され、より頑健で安全性が重要な検出システムを開発するための基盤リソースとして位置付けられている。

Abstract

歩行者検出は、自動運転、ロボティクス、監視にとって基礎となる技術である。深層学習の進歩にもかかわらず、遮蔽、雑然とした背景、劣化した視認性により、信頼性の高い同定は依然として困難である。マルチスペクトル検出(可視と熱赤外のセンサを組み合わせる)により視認性の悪さは緩和されるものの、カモフラージュされた歩行者という課題はいまだ十分に研究されていない。既存のカモフラージュ物体検出(COD)ベンチマークは生物種に焦点を当てており、ターゲットが周囲に溶け込む安全性が重要な人間検出の領域にはギャップがある。これに対処するために、M3FDデータセットから派生した新しいベンチマークであるCamo-M3FDを提案する。これは、位置合わせされた可視・熱赤外画像ペアから成る、クロススペクトルなカモフラージュ歩行者検出のための新規ベンチマークである。本データセットは、前景と背景の類似度が高いことを定量的な指標を用いて保証するように厳選している。高品質なピクセルレベルのマスクを提供し、最先端のCODモデルを用いた標準化された評価フレームワークを確立する。結果は、熱の信号が不可欠な位置特定の手がかりを提供する一方で、構造の詳細を洗練させるにはマルチスペクトル融合が不可欠であることを示している。Camo-M3FDは、頑健で安全性が重要な検出システムを開発するための基盤となるリソースである。本データセットはGitHubで利用可能: https://cod-espol.github.io/Camo-M3FD/