安全に整合した3D物体検出：単一車両、協調、およびエンドツーエンドの観点

arXiv cs.CV / 2026/4/7

💬 オピニオンIdeas & Deep AnalysisModels & Research

共有:

要点

本論文は、連携型かつ自動運転車における深層学習ベースの3D物体検出は、安全に整合した評価を必要とすることを主張している。標準的な指標は、知覚の誤りをすべて同程度に有害なものとして扱うが、実際には安全性に直結するサブセットが存在するためである。

要旨: 知覚は、連携型および自律型の車両（CAV）において中核的な役割を果たし、従来のモジュール型の運転スタックだけでなく、協調的な知覚システムや近年のエンドツーエンド運転モデルの基盤となっています。深層学習は知覚性能を大きく向上させましたが、その統計的性質のため、完全な予測を達成することは困難です。一方で、標準的な学習目的や評価ベンチマークは、知覚の誤りをすべて同等に扱いますが、安全性にとってクリティカルなのはその一部だけです。本論文では、高インパクトな誤りを明示的に特徴づける3D物体検出に対して、安全性に整合した評価と最適化を調査します。これまでに提案した安全志向の指標であるNDS-USCと、安全性を考慮した損失関数であるEC-IoUに基づき、我々は3つの貢献を行います。第一に、様々なニューラルネットワークのアーキテクチャとセンシングモダリティにわたる、単一車両の3D物体検出モデルに関する拡張研究を提示し、mAPやNDSといった標準的な指標で得られる改善が、NDS-USCで表される安全志向の基準に必ずしも結びつかないことを示します。EC-IoUにより、安全性を考慮したファインチューニングが、安全性にクリティカルな検出性能の向上に寄与する利点を再確認します。第二に、AVインフラ協調型の物体検出モデルに対して、自己中心（ego-centric）的で安全志向の評価を実施し、その車両のみのモデルに対する優位性を強調します。また、「Vision Zero」に対して協調モデルがどのように貢献し得るかを示す安全性影響分析を提示します。第三に、SparseDriveにEC-IoUを統合し、エンドツーエンドの「知覚から計画（perception-to-planning）」の枠組みにおいて、安全性を考慮した知覚の頑健化により衝突率をほぼ30%低減でき、システム全体の安全性を直接改善できることを示します。総じて、我々の結果は、安全性に整合した知覚の評価と最適化が、単一車両、協調、ならびにエンドツーエンド自律の各設定においてCAVの安全性を高めるための実用的な道筋を提供することを示しています。