SAMIDARE:高密度シーンに向けた高度なセグメンテーション追跡(Tracking-by-Segmentation)

arXiv cs.CV / 2026/4/27

📰 ニュースTools & Practical UsageModels & Research

要点

  • 本論文では、混雑したスポーツ環境のような密なシーンでマスク誤りやIDスイッチが起きやすい状況に対応する、セグメンテーションベースのマルチオブジェクト追跡フレームワーク「SAMIDARE」を提案しています。
  • SAMIDAREはSAM2MOTを拡張し、密度に応じたマスクの再生成と、選択的なメモリ更新を追加することで、難しい視覚条件下でも対象の特徴をより適切に保持します。
  • さらに、相互オクルージョンや頻繁なフレームアウトに対して頑健性を高めるため、状態を考慮した関連付けと新規トラックの初期化を採用しています。
  • SportsMOTデータセットで評価した結果、SAMIDAREは検証セットにおいてベースラインをHOTAで2.5点、IDF1で4.2点上回るなど、最先端の性能を達成しています。
  • 著者は再現性のためにコードをGitHubで公開しており、今後の発展にもつながります。

概要: 自動化されたスポーツ解析では、頑健なマルチオブジェクト追跡(MOT)が求められますが、セグメンテーションベースの手法は、密集したシーンではマスク誤りやIDスイッチにしばしば苦戦します。そこで本研究では、混雑したシーンにおいてSAM2MOTを強化するフレームワークSAMIDAREを提案します。これは、3つの主要コンポーネントによって実現されます:(1)密度に応じたマスク再生成と(2)選択的メモリ更新の両方で、ターゲットの特徴の完全性を保持するための適応的なマスク制御を行い、さらに(3)状態を考慮したアソシエーションと新規トラックの初期化により、相互の遮蔽や頻繁なフレームアウト事象の下でも頑健性を高めます。SportsMOTデータセットで評価したところ、SAMIDAREは最先端の性能を達成し、検証セットにおいてベースラインをHOTAで2.5点、IDF1で4.2点上回りました。これらの結果は、マスク制御と状態を考慮したアソシエーションによる適応的な特徴管理が、密集スポーツ追跡に対して頑健で効率的な解決策を提供することを示しています。コードは https://github.com/ZabuZabuZabu/SAMIDARE で利用可能です