要旨: 基盤モデルはソーシャルロボティクスを発展させ、より豊かな知覚とユーザとのコミュニケーション的な相互作用を可能にしました。しかし、現在のシステムは、マルチターンにわたる関与、社会的関係の推論、そして大規模環境での文脈に根ざした対話にいまだ苦戦しています。私たちは、ARIS(Agentic and Relationship Intelligence System)を提案します。これは、マルチモーダル推論、グラフベースのソーシャル・ワールド・モデル、そして想起拡張生成(RAG)を、ソーシャルロボット向けに単一のモジュール型アーキテクチャに統合するエージェント型AIフレームワークです。私たちは、ロボットを介した二者間会話の場でPepperロボットを用いてARISを評価し、大規模言語モデルを基準として比較します。ユーザスタディ(N=23)により、ARISは、知能の知覚、躍動感、擬人性、好感度において有意に高い結果を示すことが分かりました。私たちの貢献は3点です。 (1)〜ソーシャル・ワールド・モデル:知識グラフを通じて、ユーザ間の社会的関係を明示的に対応付け、更新することで、ソーシャル推論と出会いをまたいだ再識別を可能にすること。 (2)〜対話履歴が数千ターンに増えても、応答の関連性を保ちつつレイテンシを上限付きに維持する効率的な、RAGベースの会話パイプライン。 (3)〜これらのコンポーネントをモジュール型エージェント型アーキテクチャ内で統合し、構造化されたAPIを通じて音声・視覚・物理的な行動を調整する形で実証的に検証すること。ARISの実装は、出版後にオープンソースとして公開します。
ARIS:ソーシャルロボット向けのエージェント型および関係インテリジェンス・システム
arXiv cs.RO / 2026/5/5
📰 ニュースDeveloper Stack & InfrastructureSignals & Early TrendsModels & Research
要点
- この論文では、マルチモーダル推論、グラフベースのSocial World Model、リトリーバル強化生成(RAG)を統合した、ソーシャルロボット向けのエージェント型AIフレームワークARISを提案しています。
- ARISは、現在のソーシャルロボットの課題である多ターンでの関与、社会的な関係の推論、会話の文脈に根ざした対話を大規模に行うことを改善することを狙っています。
- Pepperロボットを用いた二者間のロボット仲介会話でARISを大規模言語モデルのベースラインと比較し、ユーザーが知覚する成果を高めることを示しています。
- 参加者23名のユーザー調査により、ARISは知覚される知能、いきいき感、擬人化、好感度の各項目で有意に高い評価を得たと報告されています。
- 主な貢献として、関係を知識グラフで明示的に追跡する仕組み、対話が数千ターンに増えても遅延を抑えつつ関連性を保つ効率的なRAGパイプライン、音声・視覚・物理行動を構造化APIで統合連携する実装が挙げられ、出版後にオープンソース公開予定です。

