MARS:マルチモーダル大規模言語モデルによる支援知能のためのマルチエージェントロボットシステム
arXiv cs.RO / 2026/4/8
💬 オピニオンSignals & Early TrendsIdeas & Deep AnalysisModels & Research
要点
- 本論文は、マルチモーダル大規模言語モデル(MLLM)によって駆動される、支援知能のためのスマートホーム向けマルチエージェントロボットシステム「MARS」を導入し、リスクを考慮した計画やユーザーパーソナライズといった課題に取り組む。
- MARSは、視覚知覚、リスク評価、計画、評価の4つの専門エージェントを用いて、散らかった屋内環境の理解を実行可能で協調された一連の行動へ変換する。
- 本フレームワークは、階層的なマルチエージェント意思決定によって、言語による計画を行動手順へと基底付け(grounding)することを重視し、動的な家庭環境において適応的な支援を可能にする。
- 複数のデータセットでの実験により、特にリスクを考慮した計画やマルチエージェントの実行協調において、最先端のマルチモーダルモデルよりも性能が向上することが報告されている。
- 著者らは、このアプローチを、現実の支援シナリオにおいて協調的なMLLM対応マルチエージェントシステムを導入するための、汎用的な手法(一般化可能な方法論)として位置づけている。



