Long-SCOPE:完全スパースな長距離協調3D知覚

arXiv cs.CV / 2026/4/13

📰 ニュースIdeas & Deep AnalysisModels & Research

要点

  • Long-SCOPEは、V2X通信を用いた協調3D知覚のための完全スパースなフレームワークとして提示されており、検知範囲の拡張と自動運転における死角の解消を目指す。
  • 本研究は、既存手法における2つの主要な導入ボトルネックに焦点を当てている:密なBEV表現に起因する二次スケーリングと、大きな観測/アライメント誤差下での脆い特徴対応付けである。
  • 小さく遠方にある物体の検出を改善するための、ジオメトリ誘導型クエリ生成(Geometry-guided Query Generation)モジュールを導入する。
  • 位置ノイズが極めて深刻な場合でもクエリを頑健にマッチングするための、学習可能なコンテキスト対応付け(Context-Aware Association)モジュールを提案する。
  • V2X-SeqおよびGriffinデータセットでの実験により、最先端の結果が報告されており、特に困難な100〜150mの長距離シナリオで大きな改善が見られる。一方で、計算コストと通信コストは競争力を維持している。

概要: 車両対すべて(Vehicle-to-Everything)通信による協調型3D知覚は、自動運転を強化する有望なパラダイムであり、検知範囲の拡張と遮蔽物の解消を提供します。しかし、既存手法の実用的な導入は、長距離において2つの重要なボトルネックにより妨げられています。すなわち、密なBEV表現における二次的な計算スケーリングと、重大な観測誤差および位置合わせ誤差下での特徴対応付けメカニズムの脆弱性です。これらの制約を克服するために、頑健な長距離協調型3D知覚のための完全スパースな枠組みであるLong-SCOPEを提案します。本手法は2つの新規コンポーネントを備えています。小さく、遠方の物体を正確に検出するためのジオメトリ誘導型クエリ生成モジュールと、強い位置ノイズがある状況でも協調クエリを頑健に対応付けする学習可能な文脈対応型(Context-Aware)アソシエーションモジュールです。V2X-SeqおよびGriffinのデータセットでの実験により、Long-SCOPEが最先端の性能を達成することが検証されます。特に、100〜150mの長距離設定という困難な条件で顕著でありながら、計算コストおよび通信コストはいずれも非常に競争力の高い水準を維持しています。