自己予測表現による自律UAVのオブジェクト目標ナビゲーション
arXiv cs.RO / 2026/4/24
📰 ニュースModels & Research
要点
- 本論文は、自律UAVのための3Dオブジェクト目標ナビゲーションに強化学習を用いる手法を提案し、未知の目標位置をマルコフ決定過程として明確にモデル化しています。
- 特に目標認識がオブジェクト目標ナビゲーション(OGN)を複雑にする状況で、良いナビゲーション方策を得る際のRLにおけるサンプル効率の課題に焦点を当てています。
- 主な技術的貢献は知覚モジュールとして新しい自己予測モデル AmelPred を開発し、さらに確率版(AmelPredSto)も含めて状態表現学習を行う点です。
- 実験では、状態表現学習(SRL)のさまざまな手法が、モデルフリーのアクタークリティック型強化学習の計画手法とどう相互作用するかを評価し、AmelPredSto が最も良い性能を示すと結論づけています。
- AmelPredSto を用いることで、OGN課題の解決における強化学習アルゴリズムの効率が大きく改善されることが示されています。
関連記事
Qwen3.6-27B-INT4:vLLM 0.19で1基のRTX 5090により256kコンテキスト時に100 tps超を実現
Reddit r/LocalLLaMA

llama-serverでPaddleOCR-VL-1.5を使って書籍をOCRする方法
Reddit r/LocalLLaMA
エージェント型推論に本当に効く大型言語モデルのベンチマーク7選
MarkTechPost

OpenAIがPII(個人情報)を検出・マスキングする新モデルを公開
Reddit r/LocalLLaMA
kreuzcrawl:11の言語バインディングを備えたオープンソースのRustクローリングエンジン
Reddit r/LocalLLaMA