多物体トラッキングのためのハイパーグラフ状態協調推論

arXiv cs.CV / 2026/4/15

💬 オピニオンIdeas & Deep AnalysisModels & Research

要点

  • 本論文は、既存の多物体トラッキングにおける運動推定の2つの重要な弱点、すなわちノイズや確率的予測による不安定性、ならびに遮蔽物による軌跡の断片化を扱う。
  • 相関のある物体同士が運動状態を相互に拘束し合う協調推論フレームワークを提案することで、推定の安定化と遮蔽物下における軌跡の妥当な連続性の維持を実現する。
  • 提案手法であるHyperSSMは、ハイパーグラフモジュール(動的なハイパーエッジを用いて空間的な運動相関をモデル化)と、状態空間モデル(SSM)(構造化された状態遷移により時間的な滑らかさを強制)を組み合わせる。
  • MOT17、MOT20、DanceTrack、SportsMOTでの実験により、多様な運動パターンやシーンの複雑さにわたって最先端の結果が示される。
  • 全体として、本研究は、空間的コンセンサスと時間的整合性を共同で最適化する統一的な空間-時間推論により、より頑健なMOTを実現する。

要旨: 動きの推論は、多対象追跡(MOT)の基盤である。これは、フレーム間で目標を一貫して関連付けることを可能にするからである。しかし、既存の動き推定手法には主に2つの大きな制限がある。(1) ノイズの多い、あるいは確率的な予測によって引き起こされる不安定性、(2) 視覚的手がかりが消えると軌跡がしばしば分断されるという遮蔽(オクルージョン)下での脆弱性である。これらの課題を克服するために、複数の相関する対象間の共同推論により動き推定を強化する協調的推論フレームワークを提案する。動き状態が類似した対象同士が互いに制約を与え、推定を洗練できるようにすることで、本フレームワークはノイズのある軌跡を安定化し、対象が遮蔽されている場合でももっともらしい運動の連続性を推定する。これを実現するために、空間-時間の統一的な推論のためにハイパーグラフ計算と状態空間モデル(SSM)を統合したアーキテクチャである HyperSSM を設計する。ハイパーグラフモジュールは動的なハイパーエッジにより空間的な運動相関を捉え、SSM は構造化された状態遷移を通じて時間的な滑らかさを保証する。この相乗的な設計により、空間の一致と時間的な整合性を同時に最適化でき、頑健で安定した運動推定が実現される。MOT17、MOT20、DanceTrack、SportsMOT の4つの主要かつ多様なベンチマークに対して、さまざまな運動パターンとシーンの複雑さをカバーした大規模な実験を行った結果、提案手法は幅広い追跡シナリオにおいて最先端の性能を達成することが示された。