ScoRe-Flow:フローマッチングのためのスコアベース強化学習による分布制御の完全実現
arXiv cs.RO / 2026/4/14
📰 ニュースSignals & Early TrendsIdeas & Deep AnalysisModels & Research
要点
- 本論文では、ロボット制御に用いられるフローマッチング(FM)方策を微調整するための、スコアベース強化学習アプローチであるScoRe-Flowを提案する。
- 先行するFM RL手法の主要な制約として、SDEのドリフトをスコア(対数密度の勾配)で変調し、高確率領域へ探索を誘導することで安定性を向上させる点に焦点を当てて解決する。
- ScoRe-Flowは、速度場から閉形式でスコアを計算することで補助ネットワークを不要にし、さらに分散も予測して、確率的遷移における平均と分散の制御を分離する。
- 実験結果では、D4RLの移動(ロコモーション)タスクにおいて、従来のフローベースの最先端手法に比べて収束が2.4倍高速であることを示す。
- 本手法は、RobomimicおよびFranka Kitchenの操作ベンチマークにおいて、最大で成功率が5.4%向上したとも報告している。




