DinoRADE:視覚基盤モデル特徴を用いたフルスペクトル・レーダー-カメラ融合による悪天候下での多クラス物体検出
arXiv cs.CV / 2026/4/10
💬 オピニオンSignals & Early TrendsIdeas & Deep AnalysisModels & Research
要点
- DinoRADEは、密なFMCWレーダーテンソルとカメラ視覚特徴を融合することで、悪天候下における物体検出の頑健性を高めることを目的とした、レーダー中心のマルチモーダル知覚パイプラインである。
- 本手法は、カメラ変換した基準点の周囲に視覚特徴を集約し、変形クロスアテンションを用いることで、小さな脆弱な道路利用者(VRU)を検出するのに必要な微細な空間的詳細をより良く復元する。
- 視覚入力はDINOv3の視覚基盤モデルから得ており、特徴抽出を行った後、レーダー特徴と融合して多クラス検出を実現する。
- 著者らは、すべての天候条件にわたってK-Radarデータセットで評価を行い、5つの物体クラスごとの性能を報告し、従来のレーダー-カメラ手法に比べて12.1%の改善を達成した。
- コードはRADE-Netリポジトリの下で公開されており、再現性と、安全性が重要な運転向け知覚におけるレーダー-カメラ融合に関するさらなる研究を支援する。




