大規模な実環境シーンにおけるビュー間相互作用とグラウンドへの着地を用いたマルチビュー群衆トラッキング・トランスフォーマー

arXiv cs.CV / 2026/4/22

📰 ニュースSignals & Early TrendsModels & Research

要点

  • 本論文は、カメラ視点間の相互作用と地面(グラウンドプレーン)をモデル化してマルチビュー追跡性能を高める、Transformerベースのマルチビュー群衆トラッキング手法MVTrackTransを提案しています。
  • 従来のCNNベースのマルチビュー群衆トラッキングはWildtrackやMultiviewXのような小規模データセットに基づく評価が中心であり、大きな空間や強い遮蔽を伴う実環境へ適用しづらいという課題があります。
  • このギャップを埋めるために、著者らは大規模で実環境に近いマルチビュー追跡データセットMVCrowdTrackとCityTrackを新たに収集・注釈付けし、より広いシーンと長い時間スパンをカバーできるようにしました。
  • 新しい大規模データセットでの実験では、MVTrackTransが既存手法より高い性能を示し、大規模で複雑な実環境に適していることが示されています。
  • データセットとコードはGitHubで公開されており、タスクのさらなる研究とより実践的な活用を後押しします。