SynMVCrowd:マルチビューの群衆カウントとローカリゼーションのための大規模合成ベンチマーク

arXiv cs.CV / 2026/3/26

📰 ニュースSignals & Early TrendsIdeas & Deep AnalysisModels & Research

要点

  • 本論文は、従来の小規模シーンのデータセットよりも、マルチビューの群衆カウントとローカリゼーションの評価をより実用的にすることを目的とした大規模合成ベンチマーク「SynMVCrowd」を提案する。
  • SynMVCrowdは、多数のマルチビュー・フレーム、複数のカメラ視点、そして大幅に大きい群衆数(最大1000)を含む50の合成シーンで構成される。
  • 著者らは、マルチビューの群衆ローカリゼーションとカウントの両方に対する強力なベースライン手法を提示し、新しいベンチマークにおいて既存手法よりも性能が向上することを報告している。
  • 本研究は、SynMVCrowdでの学習/評価がドメイン転送を改善し、新たに導入された実シーンにおけるマルチビューおよび単一画像のカウントを強化し得ることを示している。
  • コードとデータセットは、提供されたGitHubリポジトリのリンクを通じて公開され、追補的な研究を支援する。