AI Navigate

MicroVision: 脆弱な道路利用者とミクロモビリティ車両を検出するための公開データセットとベンチマークモデル

arXiv cs.CV / 2026/3/20

📰 ニュースTools & Practical UsageModels & Research

要点

  • MicroVision プロジェクトは、VRUの視点からVRUとミクロモビリティ車両を検出するための公開画像データセットと注釈を導入し、既存データセットのギャップを埋めるためにVRUとMMVを単なる「人」としてラベル付けするのではなく区別することにより対応しています。
  • データはスウェーデンの Gothenburg(現地名 Göteborg、英語名 Gothenburg)で収集され、約2,000の相互作用シーンにわたり、8,000枚を超える匿名化されたフルHD画像と、3万を超えるラベル付きVRUおよびMMVが含まれています。
  • 最先端アーキテクチャに基づくベースラインの物体検出モデルは、未見のテストセットにおいて平均適合率(mAP)を最大0.723まで達成します。
  • 提供された DOI を通じてデータセットとモデル重みは公開されており、研究者や実務者が交通安全と監視のための VRU および MMV 検出システムを訓練・評価できるようになっています。

概要: ミクロモビリティは成長する移動手段であり、VRU(脆弱な道路利用者)がマイクロモビリティとインフラを共有する区域で相互作用が増えることにより、交通安全と計画に新たな課題を生じさせています。これには駐車中のマイクロモビリティ車両(MMV)も含まれます。交通安全と計画を支援するアプローチは、ますます画像中の道路利用者の検出に依存するようになっています。これは、訓練データの品質に大きく依存する、画像を用いたコンピュータビジョンのタスクです。しかし、こうしたデータセットはVRUおよびMMVの焦点と多様性に欠けています。たとえば、歩行者とMMVライダーの両方を「人」として分類したり、e-scooterのような新しいMMVが含まれていなかったりします。さらに、データセットは車の視点で撮影されることが多く、VRUのみが移動する区域(歩道、自転車道)からのデータが不足しています。このギャップを埋めるために、MicroVisionデータセットを導入します。これは、VRUの視点から最も一般的なVRU(歩行者、サイクリスト、e-scooter利用者)と静止しているMMV(自転車、e-scooter)を検出するための訓練・評価用オープン画像データセットと注釈です。このデータセットは、スウェーデンのゴーテボリで収録され、1年間にわたり、ほぼ2,000のユニークな相互作用シーンの一部を含む、8,000を超える匿名化されたフルHD画像と、30,000を超える慎重に注釈されたVRUおよびMMVから構成されています。データセットとともに、最先端のアーキテクチャに基づく初のベンチマーク用の物体検出モデルを提供します。これらは未知のテストセットで最大の平均適合率(mAP)0.723を達成しました。データセットとモデルは、異なるVRUおよびMMVを区別する交通安全を支援したり、監視システムがマイクロモビリティの利用を識別するのを助けたりすることができます。データセットおよびモデルの重みは、https://doi.org/10.71870/eepz-jd52 からアクセスできます。