半静的シーンに対する予測型スペース・タイム・シーングラフ

arXiv cs.RO / 2026/5/4

📰 ニュースIdeas & Deep AnalysisModels & Research

要点

  • この論文は、spatio-semanticなシーン表現の重要な制約として、従来の多くの手法が幾何と意味の推論はできても時間方向の推論を明示的に扱えていない点を問題提起しています。
  • それに対して、(家庭内でマグが毎日決まった動きをするような)構造化された反復的変化を持つ環境向けに、tempo-spatio-semanticな推論手法を提案します。
  • 中核となるのは Perpetua* フィルタで、時間を通じて観測された状態に対してベイズ推論を行い、3Dシーングラフである PredictiveGraphs に組み込まれています。
  • PredictiveGraphs では、オブジェクトがノード、辺が Perpetua* フィルタとして機能し、時間変化を伴う spatio-semantic 関係を符号化します。
  • シミュレーションと実世界のダイナミックなナビゲーション課題の両方で検証され、分布シフトがあっても将来の環境状態の予測性能がベースラインより優れていることが示されています。

Abstract

私たちは、ロボットが幾何と意味論にまたがる複雑な推論を実行できる「時空間-意味論(spatio-semantic)」表現を構築する能力において、近年目覚ましい進展があったことを見てきました。しかし、これらの手法の大多数は、時間をまたいだ推論を行う能力を持っていません。この性質は、ロボットが環境を繰り返し観測する状況で、観測の間にインスタンスが変化しうるものの、それが構造化された形で起こる場合に望ましいものです。例えば家庭環境を考えてみてください。マグ(コップ)の位置は、通常は食器棚からカウンタートップへ、さらにシンクへ移動し、その後毎日また食器棚へ戻ります。私たちは、このような周期的な振る舞いを学習し、それを用いて将来におけるマグの状態を予測できるようにすべきです。本研究では、この種のテンポ(tempo)-時空間-意味論推論を実行可能な手法を提案します。この手法を支えるのは、時間をかけて観測される環境の状態に対してベイズ推論を行うフィルタ、Perpetua^*です。このフィルタは、PredictiveGraphs と呼ぶ3Dシーングラフ構造の中に統合されており、ノードは物体を表し、エッジは Perpetua^*フィルタとして機能し、時空間-意味論的な関係を符号化します。私たちは、本手法をシミュレーションと、実世界の動的ナビゲーション課題の両方で検証します。実世界の実験は、3週間の期間にわたり2時間ごとの頻度で、環境が半静的に変化している状況で行いました。これらの両方の設定において、私たちは分布のシフトが存在する場合でも、将来の環境状態の予測において提案手法がベースラインを上回ることを示します。