E-SocialNav:言語モデルによる効率的かつ社会的に準拠したナビゲーション

arXiv cs.RO / 2026/3/24

💬 オピニオンSignals & Early TrendsIdeas & Deep AnalysisModels & Research

要点

  • 本論文は、既存のロボットナビゲーションのベンチマークはタスクの成功に焦点を当てがちであり、ロボット挙動における「社会的準拠(social compliance)」の評価が十分に行われていないと主張する。
  • GPT-4oおよびClaudeを対象に、社会的に準拠したナビゲーションを評価し、大規模言語モデルはレイテンシ(遅延)や消費エネルギーのコストにより、リアルタイムかつリソース制約のあるロボットでは非効率になり得ることを示す。
  • 著者らは、比較的小規模なデータセットで学習し、社会的に準拠した行動を生成する、より効率的な言語モデルアプローチとしてE-SocialNavを提案する。
  • E-SocialNavは2段階の学習パイプライン(教師あり微調整の後に直接選好最適化)を用い、ゼロショットのベースラインを上回るとともに、人間の注釈に対する意味的一致度と行動精度の両方を改善する。
  • 提案手法のソースコードはGitHubで公開されており、社会的に準拠したナビゲーション方法に関するさらなる実験やベンチマークが可能になる。

E-SocialNav:言語モデルによる効率的かつ社会的に準拠したナビゲーション | AI Navigate