VULCAN:屋内火災災害対応のための、視覚言語モデル強化マルチエージェント協調ナビゲーション

arXiv cs.RO / 2026/4/15

📰 ニュースSignals & Early TrendsIdeas & Deep AnalysisModels & Research

要点

  • 本論文は、マルチモーダル知覚と視覚言語モデル(VLM)を組み合わせることで、屋内火災災害対応に特化したマルチエージェント協調ナビゲーションの枠組みVULCANを提案する。
  • 著者らは、既存のマルチエージェントナビゲーションシステム—通常は視覚のみで構築され、良性の環境を前提としている—が、煙・熱・レイアウト変化といった火災特有のダイナミクス下では大幅に性能が低下すると主張する。
  • 著者らは、より信頼性の高い評価を可能にするため、煙の拡散、熱的危険、センサ劣化などを含む物理的に現実的な火災シミュレーションによって、Habitat-Matterport3Dベンチマークを拡張する。
  • 実験では、通常環境と火災による状況の両方で、複数のベースラインの協調ナビゲーション手法を比較し、重要な失敗モードを特定するとともに、頑健な危険を意識した知覚と計画の必要性を示す。

Abstract

屋内の火災災害は、濃い煙、高温、そして動的に変化する屋内環境のため、自律型の捜索・救助に対して重大な課題をもたらします。このような時間制約の厳しい状況では、マルチエージェントによる協調ナビゲーションは、単一エージェント手法よりも速く、より広範な探索を可能にするため、特に有用です。しかし、既存のマルチエージェント・ナビゲーションシステムは主として視覚ベースであり、無害な屋内環境を想定して設計されているため、火災によって引き起こされる動的な条件下では大幅な性能低下が生じます。本論文では、屋内火災災害対応に合わせて設計した、マルチモーダル知覚と視覚言語モデル(VLM)に基づくマルチエージェント協調ナビゲーションフレームワークであるVULCANを提案します。私たちは、Habitat-Matterport3Dベンチマークを拡張し、煙の拡散、熱的な危険、そしてセンサの劣化を含む、物理的に現実的な火災シナリオをシミュレーションします。さらに、正常環境と火災によって駆動される環境の両方において、代表的なマルチエージェント協調ナビゲーションのベースラインを評価します。その結果、火災シナリオにおいて既存手法が示す重要な失敗モードを明らかにし、信頼できるマルチエージェント捜索・救助のためには、頑健な知覚と危険を考慮した計画が不可欠であることを示します。