Flow-Opt:フローマッチングと微分可能最適化による大規模・集中型マルチロボット軌道最適化

arXiv cs.RO / 2026/4/21

📰 ニュースDeveloper Stack & InfrastructureSignals & Early TrendsModels & Research

要点

  • Flow-Optは、集中型マルチロボットの関節空間軌道最適化を計算的に扱いやすくする学習ベース手法で、特に散らかった環境や狭い空間での計画に焦点を当てています。
  • この手法は、生成モデルで多様な候補軌道をサンプリングし(順列不変なロボット位置と地図エンコーダを備えた拡散トランスフォーマによるフローマッチング)、推論時には学習済みのSafety-Filterで制約を高速に満たします。
  • Flow-Optは、Safety-Filter向けのカスタムソルバにニューラルな初期化ネットワークを組み込み、ソルバの微分可能性を活かして自己教師ありで初期化ネットワークを学習します。
  • 実験では、何十台ものロボットに対して、数十ミリ秒で衝突回避を含む滑らかな軌道を生成できることが報告されており、従来の集中型最適化や拡散モデル系ベースラインよりも優れた高速性・滑らかさが示されています。
  • システムはバッチ処理に適した設計で、複数の問題インスタンスを数十分の一秒といった短時間で解けるほか、固定された出発・到達点間でも衝突回避の異なる挙動を表す多様な軌道集合を生成できます。

要旨: 複数ロボットの関節空間における集中型軌道最適化は、より大きな実現可能空間へのアクセスを可能にし、その結果として、特に狭い空間で計画する際に滑らかな軌道を得ることができます。残念ながら、非常に小さな群サイズを超えると計算的に扱いにくくなることが多いです。本論文では、集中型マルチロボット軌道最適化の計算可能性(計算の実行可能性)を改善するための学習ベース手法としてFlow-Optを提案します。具体的には、まず異なる候補軌道をサンプリングするための生成モデルを学習し、次に学習したSafety-Filter(SF)を用いて推論時に高速に制約充足を保証することで、この問題を低減します。生成モデルとして、順列不変なロボット位置エンコーダおよび地図エンコーダを付加した拡散トランスフォーマ(DiT)によるフローマッチングモデルを提案します。さらに、SFのための独自ソルバを開発し、状況(コンテキスト)に応じた初期化を予測するニューラルネットワークを組み込みます。初期化ネットワークは自己教師あり方式で学習され、SFソルバの微分可能性を活用します。以下の点で最先端を前進させます。第一に、混雑した環境において数十台のロボットの軌道を、数十ミリ秒で生成できることを示します。これは既存の集中型最適化手法よりも数倍高速です。さらに本手法は、拡散モデルに基づく競合ベースラインよりも、桁違いに速く滑らかな軌道も生成します。第二に、本手法の各コンポーネントはバッチ化できるため、数十個の問題インスタンスを一秒未満の一部で解けます。これは最初のそのような結果であると考えます。既存のいかなる手法も、このような能力を提供していません。最後に、本手法は、与えられた開始位置と目標位置の集合の間で多様な軌道の集合を生成でき、異なる衝突回避の振る舞いを捉えることができます。