推測的ポリシー・オーケストレーション: クラウド-ロボティック操作の遅延耐性フレームワーク

arXiv cs.RO / 2026/3/23

📰 ニュースDeveloper Stack & InfrastructureModels & Research

要点

  • SPO は、クラウド上にホストされたワールドモデルを用いて将来の運動学的ウェイポイントを事前計算し、ローカルのエッジバッファへストリーミングする遅延耐性のクラウド-エッジフレームワークで、実行頻度をネットワーク往復遅延時間から切り離す。
  • エッジ上では、epsilon-チューブ検証器が運動学的実行誤差を厳密に制限し、予測ドリフトによる安全でない実行を緩和します。
  • このフレームワークには適応的ホライズンスケーリングが含まれ、リアルタイムの追跡誤差に基づいて推測的プリフェッチ深度を動的に調整します。
  • エミュレートされたネットワーク遅延を用いた連続RLBenchマニピュレーションタスクで評価したところ、SPO はリモート推論をブロックする場合と比較してネットワークによるアイドル時間を60%以上削減し、静的キャッシュベースラインよりクラウド予測の破棄を約60%減らします。
  • 全体として、SPO は滑らかでリアルタイムなクラウド-ロボット制御を実現するとともに、物理的安全性を有界に保ちます。

要旨: クラウド・ロボティクスは、ロボットが高次元の運動計画と推論を遠隔サーバへオフロードできるようにします。 ただし、頻繁な制御を要する連続的な操作タスクでは、ネットワーク遅延とジッターがシステムを著しく不安定化させ、コマンドの発行が追いつかなくなるなどの影響を引き起こす可能性があります。 これに対処するため、遅延耐性を備えたクラウド-エッジフレームワークである Speculative Policy Orchestration (SPO) を提案します。 SPO はクラウド上にホストされたワールドモデルを利用して、将来の運動学的ウェイポイントを事前計算してローカルのエッジバッファへストリーミングし、実行頻度をネットワーク往復時間から切り離します。 予測ドリフトによって生じる安全でない実行を緩和するため、エッジノードは運動学的実行誤差を厳密に制限する ε-チューブ検証器を用います。 このフレームワークは、リアルタイムの追従誤差に基づいて、推測プリフェッチ深度を動的に拡大または縮小する適応的ホライゾン・スケーリング機構と結合されています。 私たちは、エミュレートされたネットワーク遅延の下で連続的な RLBench 操作タスクにおける SPO を評価します。 結果は、たとえ学習済みモデルの精度が控えめであっても、SPO がリモート推論をブロックする場合と比較して、ネットワークによって生じる待機時間を60%以上削減することを示しています。 さらに、SPO は静的キャッシュベースラインよりも約60%少ないクラウド予測を排除します。 最終的に、SPO は流れるようなリアルタイムのクラウド・ロボティクス制御を実現しつつ、物理的安全性を有界に維持します。