イベント・デプス・フュージョンに基づく高速UAVの障害物回避のためのエンドツーエンド飛行制御ネットワーク

arXiv cs.RO / 2026/3/31

💬 オピニオンSignals & Early TrendsIdeas & Deep AnalysisModels & Research

共有:

要点

本論文は、静的および動的な障害物の両方に対応するために、深度カメラデータとイベントカメラデータを融合する、高速UAVの障害物回避のためのエンドツーエンド飛行制御ネットワークを提案する。
深度（高速時のモーションブラー）とイベントカメラ（静的シーンの知覚が不十分）それぞれの補完的な制約に着想を得て、双方向クロスアテンション・モジュールによる特徴レベル融合を行う。
システムは、高品質な教師データによる模倣学習で訓練され、Spherical Principal Search（SPS）に基づくエキスパートプランナを含む。
SPSプランナは、計算複雑性をO(n^2)からO(n)へ削減しつつより滑らかな軌道を生成し、17 m/sにおいて80%以上の成功率を達成する（従来のプランナより約20%向上）。
シミュレーション結果では、複数のシーンにおいて17 m/sで70〜80%の成功率を示し、単一モダリティおよび単方向融合のベースラインを10〜20%上回ることが示される。これは、双方向融合が障害物回避の信頼性を高めることを示唆している。

要旨: 静的、動的、または混在する障害物がある複雑な環境において、安全で高速な自律飛行を達成することは依然として困難です。なぜなら、単一の知覚モダリティだけでは不十分だからです。深度カメラは静的な物体に対して有効ですが、高速でのモーションブラーに悩まされます。逆に、イベントカメラは高速な動きを捉えるのに優れていますが、静止したシーンの認識が苦手です。両センサの補完的な強みを活かすために、双方向クロスアテンション・モジュールを通じて深度画像とイベントデータの特徴レベル融合を実現する、エンドツーエンドの飛行制御ネットワークを提案します。このエンドツーエンドネットワークは、質の高い教師データに依存するイミテーション・ラーニングによって学習されます。この洞察に基づき、Spherical Principal Search（SPS）を用いた効率的なエキスパート・プランナを設計します。このプランナは、計算複雑性を $O(n^2)$ から $O(n)$ へと削減しつつ、より滑らかな軌道を生成し、17m/sで80%以上の成功率を達成します。これは従来のプランナに比べて約20%高い値です。シミュレーション実験では、本手法が多様なシーンにおいて17m/sで70-80%の成功率を示し、単一モダリティおよび一方向融合モデルを10-20%上回りました。これらの結果は、双方向融合がイベント情報と深度情報を効果的に統合し、静的・動的の両方の物体を含む複雑な環境において、より信頼性の高い障害物回避を可能にすることを示しています。

Black Hat Asia

AI Business

5分の指示で「5時間働く」TANRENのAIエージェント、労働時間の常識激変

日経XTECH

[D] 分散型プルーフ・オブ・ワーク計算は、ニューラルネットワーク学習のための協調（コーディネーション）要件をどのように扱うのか？

Reddit r/MachineLearning

Claude Codeの全ソースコードがnpmのソースマップ経由で流出していた──中身を解説

Dev.to

BYOKは単なる料金モデルではない：AIプロダクトの信頼を変える理由

Dev.to

イベント・デプス・フュージョンに基づく高速UAVの障害物回避のためのエンドツーエンド飛行制御ネットワーク

要点

関連記事

Black Hat Asia

5分の指示で「5時間働く」TANRENのAIエージェント、労働時間の常識激変

[D] 分散型プルーフ・オブ・ワーク計算は、ニューラルネットワーク学習のための協調（コーディネーション）要件をどのように扱うのか？

Claude Codeの全ソースコードがnpmのソースマップ経由で流出していた──中身を解説

BYOKは単なる料金モデルではない：AIプロダクトの信頼を変える理由

関連おすすめサービス

Notta搭載AI議事録イヤホン ZENCHORD1

AI搭載ボイスレコーダー Plaud

画像高画質化AIツール Aiarty Image Enhancer