OFlow:物体認識に基づく時系列フローマッチングを注入することでロバストなロボット操作を実現
arXiv cs.RO / 2026/4/21
📰 ニュースIdeas & Deep AnalysisModels & Research
要点
- 本論文は、ロボット操作において将来の状況変化の予測と、複雑なシーン内のタスクに関係する物体情報を同時に扱うことで性能を高める枠組みとしてOFlowを提案している。
- 従来のVLAが主に現在フレームに基づいて動作し、将来予測と物体認識的推論が別々の潜在空間で学習されがちであるのに対し、OFlowはそれらを共通のセマンティック潜在空間に統合する。
- OFlowは時間的フローマッチングにより将来の潜在表現を予測し、そこから物体に配慮した表現へと因数分解することで、物理的に重要な手がかりを強調しつつタスクに無関係な変動を抑える。
- さらに、連続的なアクション生成をこれらの予測済み・物体認識的な潜在表現に条件付けすることで、分布シフト下でもより信頼性の高い制御を可能にする。
- LIBERO、LIBERO-Plus、MetaWorld、SimplerEnvの各ベンチマークと実世界タスクでの実験結果から、物体認識に基づく先読みがロバスト性と成功率を一貫して高めることが示されている。
関連記事

新しいモデルが出るたびに、当然ながら古いモデルは時代遅れになる
Reddit r/LocalLLaMA

NVIDIA DGX SparkフルスタックAIハッカソンで作ったものが総合1位に—『Starfire』から『Molecules AI』へ
Dev.to

進捗を失わない:VS Codeでプロ仕様のJupyterワークフローをセットアップする(Colabのタイムアウトともおさらば!)
Dev.to

AgentOSを作る:保険請求の「AWS Lambda」を目指している理由
Dev.to

状況はここまで来た——1年で何もかも変わった:Kimi、Minimax、Qwen、Gemma、GLM
Reddit r/LocalLLaMA