E-SocialNav：言語モデルによる効率的かつ社会的に準拠したナビゲーション

arXiv cs.RO / 2026/3/24

💬 オピニオンSignals & Early TrendsIdeas & Deep AnalysisModels & Research

共有:

要点

本論文は、既存のロボットナビゲーションのベンチマークはタスクの成功に焦点を当てがちであり、ロボット挙動における「社会的準拠（social compliance）」の評価が十分に行われていないと主張する。
GPT-4oおよびClaudeを対象に、社会的に準拠したナビゲーションを評価し、大規模言語モデルはレイテンシ（遅延）や消費エネルギーのコストにより、リアルタイムかつリソース制約のあるロボットでは非効率になり得ることを示す。
著者らは、比較的小規模なデータセットで学習し、社会的に準拠した行動を生成する、より効率的な言語モデルアプローチとしてE-SocialNavを提案する。
E-SocialNavは2段階の学習パイプライン（教師あり微調整の後に直接選好最適化）を用い、ゼロショットのベースラインを上回るとともに、人間の注釈に対する意味的一致度と行動精度の両方を改善する。
提案手法のソースコードはGitHubで公開されており、社会的に準拠したナビゲーション方法に関するさらなる実験やベンチマークが可能になる。

日経XTECH

日経XTECH

日経XTECH

日経XTECH

日経XTECH