記憶拡張検索によるイベント中心の環境モデリング:身体化された意思決定のために

arXiv cs.RO / 2026/4/10

💬 オピニオンSignals & Early TrendsIdeas & Deep AnalysisModels & Research

要点

  • 本論文は、身体化エージェントのためのイベント中心の環境モデリング枠組みを提案する。環境を、順列不変な潜在表現に符号化された構造化セマンティックなイベントとして表現する。
  • 複雑なエンドツーエンドの方策ではなく、意思決定は、過去のイベントからマヌーバ(操縦)への経験の知識バンクから、記憶を拡張した検索によって行う。取得した解を重み付きの組み合わせとして行動を生成する。
  • 本アプローチは、格納された事例(ケース)に現在の意思決定を明示的に結び付けることで、一般的な学習ベース手法よりも解釈可能であることを目指している(事例ベース推論)。
  • 検索プロセスに物理に基づく制約を組み込むことで、観測されたシステムダイナミクスと整合するマヌーバを選択することを狙う。
  • UAV(無人航空機)の飛行シナリオでの実験により、この手法が解釈可能で物理的に整合した振る舞いを生成しつつ、リアルタイムの制御制約を満たし得ることが示される。

Abstract

動的かつ安全性に重要な環境で動作する自律エージェントには、計算効率が高く、かつ物理的に根拠づけられた意思決定の枠組みが必要です。しかし、既存の多くの手法はエンドツーエンド学習に依存しているため、しばしば解釈可能性に欠け、物理制約との整合性を保証する明示的な仕組みがありません。本研究では、身体化された意思決定のための、記憶拡張型リトリーバルを備えたイベント中心の世界モデリング枠組みを提案します。この枠組みは、環境を構造化された意味イベントの集合として表現し、それを順列不変な潜在表現へ符号化します。意思決定は、過去の経験の知識バンクに対するリトリーバルによって行われます。そこでは、各エントリがイベント表現と対応する操縦(マヌーバ)を関連づけます。最終的な行動は、リトリーバルされた解の重み付き結合として計算され、意思決定と保存された経験の間に、透明性のあるつながりを提供します。提案設計は、動的環境の構造化された抽象化を可能にし、事例(ケース)ベース推論による解釈可能な意思決定を支援します。さらに、物理に基づく知識をリトリーバル過程に組み込むことで、観測されたシステム動力学と整合する操縦の選択を促進します。UAV(無人航空機)飛行シナリオにおける実験評価により、この枠組みが解釈可能で一貫した振る舞いを維持しつつ、リアルタイム制御の制約内で動作することが示されます。