VULCAN：屋内火災災害対応のための、視覚言語モデル強化マルチエージェント協調ナビゲーション

arXiv cs.RO / 2026/4/15

📰 ニュースSignals & Early TrendsIdeas & Deep AnalysisModels & Research

共有:

要点

本論文は、マルチモーダル知覚と視覚言語モデル（VLM）を組み合わせることで、屋内火災災害対応に特化したマルチエージェント協調ナビゲーションの枠組みVULCANを提案する。
著者らは、既存のマルチエージェントナビゲーションシステム—通常は視覚のみで構築され、良性の環境を前提としている—が、煙・熱・レイアウト変化といった火災特有のダイナミクス下では大幅に性能が低下すると主張する。
著者らは、より信頼性の高い評価を可能にするため、煙の拡散、熱的危険、センサ劣化などを含む物理的に現実的な火災シミュレーションによって、Habitat-Matterport3Dベンチマークを拡張する。
実験では、通常環境と火災による状況の両方で、複数のベースラインの協調ナビゲーション手法を比較し、重要な失敗モードを特定するとともに、頑健な危険を意識した知覚と計画の必要性を示す。

Abstract

屋内の火災災害は、濃い煙、高温、そして動的に変化する屋内環境のため、自律型の捜索・救助に対して重大な課題をもたらします。このような時間制約の厳しい状況では、マルチエージェントによる協調ナビゲーションは、単一エージェント手法よりも速く、より広範な探索を可能にするため、特に有用です。しかし、既存のマルチエージェント・ナビゲーションシステムは主として視覚ベースであり、無害な屋内環境を想定して設計されているため、火災によって引き起こされる動的な条件下では大幅な性能低下が生じます。本論文では、屋内火災災害対応に合わせて設計した、マルチモーダル知覚と視覚言語モデル（VLM）に基づくマルチエージェント協調ナビゲーションフレームワークであるVULCANを提案します。私たちは、Habitat-Matterport3Dベンチマークを拡張し、煙の拡散、熱的な危険、そしてセンサの劣化を含む、物理的に現実的な火災シナリオをシミュレーションします。さらに、正常環境と火災によって駆動される環境の両方において、代表的なマルチエージェント協調ナビゲーションのベースラインを評価します。その結果、火災シナリオにおいて既存手法が示す重要な失敗モードを明らかにし、信頼できるマルチエージェント捜索・救助のためには、頑健な知覚と危険を考慮した計画が不可欠であることを示します。

Black Hat Asia

AI Business

AIやロボットと建築が融合、スマートビル市場が離陸へ主導権は誰に

日経XTECH

トヨタ・スズキが中国製SoC採用へ

日経XTECH

日産長期戦略「AI最大限に」、E2E自動運転モデル9割へ部品種類7割減

日経XTECH

チューリング、E2E自動運転で公道走行 VLAでは「国内初」

日経XTECH

VULCAN：屋内火災災害対応のための、視覚言語モデル強化マルチエージェント協調ナビゲーション

要点

Abstract

関連記事

Black Hat Asia

AIやロボットと建築が融合、スマートビル市場が離陸へ主導権は誰に

トヨタ・スズキが中国製SoC採用へ

日産長期戦略「AI最大限に」、E2E自動運転モデル9割へ部品種類7割減

チューリング、E2E自動運転で公道走行 VLAでは「国内初」

関連おすすめサービス

Notta搭載AI議事録イヤホン ZENCHORD1

AI搭載ボイスレコーダー Plaud

画像高画質化AIツール Aiarty Image Enhancer

要点

Abstract

関連記事

Black Hat Asia

AIやロボットと建築が融合、スマートビル市場が離陸へ 主導権は誰に

トヨタ・スズキが中国製SoC採用へ

日産長期戦略「AI最大限に」、E2E自動運転モデル9割へ 部品種類7割減

チューリング、E2E自動運転で公道走行 VLAでは「国内初」

関連おすすめサービス

Notta搭載AI議事録イヤホン ZENCHORD1

AI搭載ボイスレコーダー Plaud

画像高画質化AIツール Aiarty Image Enhancer

AIやロボットと建築が融合、スマートビル市場が離陸へ主導権は誰に

日産長期戦略「AI最大限に」、E2E自動運転モデル9割へ部品種類7割減