Chameleon:長い視野のロボットマニピュレーションのためのエピソード記憶

arXiv cs.RO / 2026/3/26

💬 オピニオンSignals & Early TrendsIdeas & Deep AnalysisModels & Research

要点

  • 本論文は、遮蔽や状態変化によって知覚のエイリアシングが生じると、意思決定時に長い視野のロボットマニピュレーションが非マルコフ(非マルコフ過程)になるため、信頼できる行動選択には記憶が必要になると主張する。
  • 人間に着想を得たChameleonというエピソード記憶アプローチを提案し、幾何学に根ざしたマルチモーダル・トークンを書き込み、目標指向のリコールのために微分可能なメモリスタックを用いる。
  • 類似度に基づくメモリ検索がしばしば捨ててしまう識別に有効な微細な手がかりを保持することを目指し、知覚的には似ているが意思決定にとっては無関係なエピソードの検索を減らす。
  • 著者らは、知覚エイリアシング条件下で、エピソード的リコール、空間トラッキング、逐次的マニピュレーションをカバーする実ロボットUR5eのデータセット「Camo-Dataset」を公開する。
  • 実験では、知覚的に紛らわしい(混同しやすい)状況において、強力なベースラインに対して意思決定の信頼性と長期ホライゾン制御が一貫して改善することが報告されている。

Abstract

ロボットによる操作はしばしば記憶を必要とします。遮蔽や状態の変化によって、意思決定時の観測が知覚的にエイリアス(曖昧化)されると、同じ観測が異なる相互作用履歴から生じうるため、観測レベルでは行動選択が非マルコフ的になります。多くの身体化エージェントは、意味的に圧縮したトレースと、類似性に基づく検索によって記憶を実装しています。これは、曖昧さを解消するきわめて細かな知覚手がかりを捨て去り、意思決定にとっては無関係ですが知覚的に似たエピソードを返してしまうことがあります。人間のエピソード記憶に着想を得て、我々は Chameleon を提案します。Chameleon は、識別のための文脈を保持するために幾何学に根ざしたマルチモーダル・トークンを書き込み、微分可能なメモリ・スタックによって目標指向の想起を生成します。また、知覚エイリアシング下でのエピソード想起、空間追跡、連続的な操作にまたがる実ロボット UR5e のデータセットである Camo-Dataset も導入します。複数のタスクにおいて、Chameleon は、知覚的に紛らわしい状況での強力なベースラインに対して、意思決定の信頼性と長いホライズンでの制御を一貫して改善します。

Chameleon:長い視野のロボットマニピュレーションのためのエピソード記憶 | AI Navigate