飛行外乱下における把持用アーム（オーバーヘッド・マニピュレータ）付きUAVのための、トランスフォーマーに基づく強化学習制御に対するメタ適応型ビームサーチ計画

arXiv cs.RO / 2026/3/30

💬 オピニオンSignals & Early TrendsIdeas & Deep AnalysisModels & Research

共有:

要点

本論文は、風や姿勢外乱によってドローンとアームの運動が結合し、エンドエフェクタの軌道追従が不十分になる問題を対象に、オーバーヘッド・マニピュレータ付きUAVのための強化学習制御フレームワークを提案する。
トランスフォーマーに基づくDDQNエージェントと組み合わせて、メタ適応型の短時間ホライズン・ビームサーチ計画器を導入し、学習済みのトランスフォーマー・クリティックを前進推定器として用いて、行動を直接適用するのではなく候補となる制御系列をシミュレートする（SITL型のルックアヘッド）。
本手法は、ルックアヘッドのために短い状態列に対する価値推定を用いる一方で、DDQNのバックボーンが1ステップ目標を与えて学習を安定化する。
同一の訓練条件の下で、3自由度の空中マニピュレータに関する実験を行った結果、本アプローチはベースラインに対して報酬を10.2%向上させ、追従誤差を約6%から3%へ低減したと報告している。
基本ドリフト外乱のもとでは、提案する計画器がより安定した先端（チップ）の軌道追従を維持し（追跡誤差は約5 cmと報告）、固定ビームおよびトランスフォーマーのみの変種を上回る。

AI Business

日経XTECH

Simon Willison's Blog

Dev.to

Dev.to