ロボットはいつ考えるべきか? 身体性を備えたロボットの意思決定のための強化学習による資源を意識した推論
arXiv cs.RO / 2026/3/27
💬 オピニオンIdeas & Deep AnalysisModels & Research
要点
- 本論文は、LLM-style 推論を用いる身体性ロボットエージェントにとっての中核的な問題を扱う。推論は意思決定を改善できる一方で、レイテンシや資源オーバーヘッドを増やし、信頼性やタスク達成を損なう可能性がある。
- RARRL(Resource-Aware Reasoning via Reinforcement Learning)を提案する。これは階層型の枠組みで、高レベルのオーケストレーション方策を学習し、いつ推論を呼び出すか、どの推論モジュールを使うか、そしてどれだけの計算予算を割り当てるかを決定する。
- オーケストレーション方策は、固定スケジュールや手作りのヒューリスティックに依存するのではなく、現在の観測、実行履歴、残りの資源に応じて適応する。
- ALFRED ベンチマークから導かれた実測レイテンシプロファイルを用いた実験により、RARRL はベースラインの推論戦略と比較して、タスク成功率を向上させると同時に、実行レイテンシを削減し、頑健性を高めることが示される。



