E-SocialNav:言語モデルによる効率的かつ社会的に準拠したナビゲーション
arXiv cs.RO / 2026/3/24
💬 オピニオンSignals & Early TrendsIdeas & Deep AnalysisModels & Research
要点
- 本論文は、既存のロボットナビゲーションのベンチマークはタスクの成功に焦点を当てがちであり、ロボット挙動における「社会的準拠(social compliance)」の評価が十分に行われていないと主張する。
- GPT-4oおよびClaudeを対象に、社会的に準拠したナビゲーションを評価し、大規模言語モデルはレイテンシ(遅延)や消費エネルギーのコストにより、リアルタイムかつリソース制約のあるロボットでは非効率になり得ることを示す。
- 著者らは、比較的小規模なデータセットで学習し、社会的に準拠した行動を生成する、より効率的な言語モデルアプローチとしてE-SocialNavを提案する。
- E-SocialNavは2段階の学習パイプライン(教師あり微調整の後に直接選好最適化)を用い、ゼロショットのベースラインを上回るとともに、人間の注釈に対する意味的一致度と行動精度の両方を改善する。
- 提案手法のソースコードはGitHubで公開されており、社会的に準拠したナビゲーション方法に関するさらなる実験やベンチマークが可能になる。