QuadAgent:ビジョン・ランゲージ指向のクアッドロトル機敏飛行のための応答性エージェントシステム
arXiv cs.RO / 2026/4/6
📰 ニュースSignals & Early TrendsIdeas & Deep AnalysisModels & Research
要点
- QuadAgentは、機敏なクアッドロトル飛行のためのトレーニング不要のビジョン・ランゲージ指向エージェントシステムとして提示されており、複雑なユーザー指示をリアルタイムに解釈することを目的としている。
- このアプローチは、高レベルの推論と低レベルの制御を非同期のマルチエージェント・アーキテクチャによって分離し、能動的なタスクにはForeground Workflow Agentsを、先読みの推論にはBackground Agentsを用いることで実現している。
- シーン理解と連続性は、「Impression Graph」と呼ばれる軽量なトポロジカル・メモリによって支えられており、疎なキーフレームから構築される。
- ナビゲーション中の安全性は、視覚ベースの障害物回避ネットワークによって対処され、雑然とした屋内環境での飛行を可能にしている。
- シミュレーションおよび実環境での結果では、効率性と応答性の向上が報告されており、デモでは最大5 m/sの速度が達成されている。



