DSERT-RoLL:ステレオ・イベントRGB・サーマルカメラ、4Dレーダー、デュアルLiDARによる多様な走行環境に対する堅牢なマルチモーダル認識

arXiv cs.CV / 2026/4/7

📰 ニュースSignals & Early TrendsIdeas & Deep AnalysisModels & Research

要点

  • 本論文は、ステレオ・イベント/RGB/サーマルカメラと4Dレーダー、デュアルLiDARを組み合わせ、さまざまな天候・照明条件を幅広くカバーする新しい走行データセットDSERT-RoLLを提案する。
  • DSERT-RoLLには、追跡IDおよびエゴビークルのオドメトリを伴う、正確な2D/3Dバウンディングボックスが含まれており、異なるセンサー構成間での公平なベンチマークを支援することを目的としている。
  • 本データセットは、イベントカメラや4Dレーダーといった新興のセンシングモダリティにおけるデータ不足を軽減し、それらの性能やフュージョン挙動を体系的に研究できるようにすることを意図している。
  • 2D/3Dの統一ベンチマーク、単一モダリティとマルチモーダルの両方に対するベースライン、および、異なるフュージョン戦略やセンサー組み合わせの研究を促すプロトコルを提供する。
  • 著者らはさらに、センサー固有の手がかりを統一された特徴空間へ写像するセンサーフュージョンの枠組みを提案し、さまざまな環境条件下での3D検出の頑健性を向上させる。

Abstract

本論文では、DSERT-RoLLという走行データセットを提案する。これは、ステレオイベントカメラ、RGBカメラ、サーマルカメラに加えて、4DレーダーおよびデュアルLiDARを統合し、多様な天候および照明条件のもとで収集したものである。このデータセットは、追跡IDと自己車両(ego vehicle)のオドメトリを含む、正確な2Dおよび3Dバウンディングボックスを提供し、センサ組み合わせの内部およびセンサ組み合わせ間での公平な比較を可能にする。イベントカメラや4Dレーダーのような新規センサに対するデータ不足を緩和し、それらの挙動に関する体系的な研究を支援することを目的としている。さらに、センサファミリ間および各ファミリ内で、特性や強みを直接比較できる統一的な3Dおよび2Dベンチマークを構築する。代表的な単一モダリティおよびマルチモダリティ手法のベースラインを報告し、異なる融合戦略やセンサ組み合わせに関する研究を促すプロトコルも提供する。加えて、センサ固有の手がかり(キュー)を統一された特徴空間に統合する融合フレームワークを提案し、多様な天候および照明下での3D検出の頑健性を向上させる。