語彙に導かれた動的グラフ学習により、ロボットに社会的相互作用を解釈させる

arXiv cs.RO / 2026/4/14

💬 オピニオンIdeas & Deep AnalysisModels & Research

要点

  • 本研究は、ユーザーの内部状態(潜在)と観察可能な行動の間にある動的な関係をモデル化することで、ロボットの社会的インテリジェンスを高める方法を提案している。
  • SocialLDGというマルチタスク学習フレームワークでは、認知科学の考えに基づき複数タスクとして状態間のダイナミクスを明示的に表現し、さらに言語モデルによる語彙的プリオリ(lexical priors)を各タスクに導入する。
  • タスク間の親和性(affinity)が時間とともに変化する点を、ダイナミック・グラフ学習で学習することで、相互作用の時間発展を捉える設計になっている。
  • 公開されている2つの人-ロボット社会的相互作用データセットで従来手法を上回る性能を示し、新タスク追加時にも壊滅的忘却を抑えつつスケールできると報告している。
  • 明示的なタスク親和性のモデリングにより、内部状態と行動が人の意思決定の中でどのように影響し合って展開するかといった分析的な洞察も得られるとしている。

Abstract

ロボットが「社会的に知的(socially intelligent)」と呼ばれるためには、現在の行動から利用者の内的状態を推論でき、その利用者の将来の行動を予測でき、必要に応じて適切に応答できなければなりません。本研究では、利用者の内的状態(潜在)と行動(観測可能な状態)の間の動的な関係をモデル化することで、ロボットにこのような社会的知能を付与する方法を検討します。私たちの前提は、これらの状態が同一の基盤となる社会認知プロセスから生じ、互いに動的に影響し合うということです。認知科学の理論に着想を得て、 \textbf{SocialLDG} と名付けた新しいマルチタスク学習の枠組みを提案します。この枠組みでは、状態間の動的関係を、6つの異なるタスクとして明示的にモデル化します。私たちの枠組みは、各タスクに対する語彙的な事前知識(lexical priors)を導入するために言語モデルを用い、時間とともに変化するタスク間の親和性(task affinity)をモデル化するために動的グラフ学習を採用します。SocialLDG には3つの利点があります。第一に、公開されている2つの難しい人-ロボットの社会的相互作用データセットにおいて最先端の性能を達成します。第二に、壊滅的忘却なしに新しいタスクをシームレスに学習することで、強力なタスク拡張性を支持します。最後に、タスク親和性を明示的にモデル化することにより、人の意思決定において内的状態と観測可能な行動がどのように相互に影響し合い、また異なる相互作用が時間の経過とともにどのように展開するのかについての洞察を提供します。