自律走行車のためのセマンティック・オブザーバレイヤ:低遅延異常検出のためのVLMの事前デプロイ実現可能性調査
arXiv cs.RO / 2026/4/1
📰 ニュースSignals & Early TrendsIdeas & Deep AnalysisModels & Research
要点
- 本論文は、自律走行車に「セマンティック・オブザーバレイヤ」を提案する。これは、量子化された視覚言語モデル(VLM)を用いて、ピクセルレベルの検出器では捉えられない文脈依存の意味論的異常を検出する。
- オブザーバはAVの制御ループと並行して1〜2 Hzで動作し、意味論的なエッジケースが特定された場合にフェイルセーフのハンドオフをトリガできる。
- 著者らは、Nvidia Cosmos-Reason1-7BにNVFP4量子化とFlashAttention2を用いた結果、推論時間は約500 msであり、同一ハードウェア上の最適化されていないFP16ベースラインに対して約50倍の高速化を達成し、低遅延のタイミング予算を満たすと報告している。
- ベンチマークは静止条件および動画条件の両方を対象とし、量子化の影響を分析する。特にNF4ではリコールが大きく崩壊(10.6%)し、これが主要なデプロイ上の制約として特定される。
- 本研究では、性能とレイテンシの指標をハザード/安全目標に結び付けることで、身体性AIのAVシステムに対する提案セマンティック・オブザーバ・アーキテクチャの事前デプロイ実現可能性を論じている。




