DiscreteRTC:離散拡散ポリシーは自然な非同期エグゼキュータである
arXiv cs.RO / 2026/4/29
📰 ニュースIdeas & Deep AnalysisModels & Research
要点
- 本論文は、物理環境で動作するAIには非同期実行(「行動しながら考える」)が必要であり、同期型エグゼキュータのチャンク間停止は、推論が速くても動的タスクに致命的だと主張する。
- それはリアルタイム・チャンク(RTC)を、確定した行動を凍結し残りを生成する「インペインティング」的な枠組みとして整理し、フローマッチング・ポリシーを用いたRTCは推論時の補正に依存するため構造的に不利だと述べる。
- 提案手法のDiscreteRTCは、行動を反復的なアンマスキングで生成する離散拡散ポリシーを用い、外部補正なしで非同期実行に自然に適合すると位置付ける。
- インペインティング挙動はネイティブな操作として扱うため追加の微調整不要であり、さらに早期停止によって推論コストも削減できるとされる。
- 動的なシミュレーションベンチマークと実世界の動的マニピュレーション課題で、連続RTCや他のベースラインより高い成功率が得られたと報告されており、特にフローマッチング型RTCに対して実世界の動的ピックで成功率が50%向上したとされる。



