要旨: 静的、動的、または混在する障害物がある複雑な環境において、安全で高速な自律飛行を達成することは依然として困難です。なぜなら、単一の知覚モダリティだけでは不十分だからです。深度カメラは静的な物体に対して有効ですが、高速でのモーションブラーに悩まされます。逆に、イベントカメラは高速な動きを捉えるのに優れていますが、静止したシーンの認識が苦手です。両センサの補完的な強みを活かすために、双方向クロスアテンション・モジュールを通じて深度画像とイベントデータの特徴レベル融合を実現する、エンドツーエンドの飛行制御ネットワークを提案します。このエンドツーエンドネットワークは、質の高い教師データに依存するイミテーション・ラーニングによって学習されます。この洞察に基づき、Spherical Principal Search(SPS)を用いた効率的なエキスパート・プランナを設計します。このプランナは、計算複雑性をO(n^2)からO(n)へと削減しつつ、より滑らかな軌道を生成し、17m/sで80%以上の成功率を達成します。これは従来のプランナに比べて約20%高い値です。シミュレーション実験では、本手法が多様なシーンにおいて17m/sで70-80%の成功率を示し、単一モダリティおよび一方向融合モデルを10-20%上回りました。これらの結果は、双方向融合がイベント情報と深度情報を効果的に統合し、静的・動的の両方の物体を含む複雑な環境において、より信頼性の高い障害物回避を可能にすることを示しています。
イベント・デプス・フュージョンに基づく高速UAVの障害物回避のためのエンドツーエンド飛行制御ネットワーク
arXiv cs.RO / 2026/3/31
💬 オピニオンSignals & Early TrendsIdeas & Deep AnalysisModels & Research
要点
- 本論文は、静的および動的な障害物の両方に対応するために、深度カメラデータとイベントカメラデータを融合する、高速UAVの障害物回避のためのエンドツーエンド飛行制御ネットワークを提案する。
- 深度(高速時のモーションブラー)とイベントカメラ(静的シーンの知覚が不十分)それぞれの補完的な制約に着想を得て、双方向クロスアテンション・モジュールによる特徴レベル融合を行う。
- システムは、高品質な教師データによる模倣学習で訓練され、Spherical Principal Search(SPS)に基づくエキスパートプランナを含む。
- SPSプランナは、計算複雑性をO(n^2)からO(n)へ削減しつつより滑らかな軌道を生成し、17 m/sにおいて80%以上の成功率を達成する(従来のプランナより約20%向上)。
- シミュレーション結果では、複数のシーンにおいて17 m/sで70〜80%の成功率を示し、単一モダリティおよび単方向融合のベースラインを10〜20%上回ることが示される。これは、双方向融合が障害物回避の信頼性を高めることを示唆している。



