SnapFlow:進行的自己蒸留によるフローマッチングVLAの1ステップ行動生成

arXiv cs.CV / 2026/4/8

📰 ニュースSignals & Early TrendsIdeas & Deep AnalysisModels & Research

要点

  • 本論文は、フローマッチングVLAモデルが通常行う多段階の反復的ノイズ除去を、1ステップ行動生成(1-NFE)のための単一のフォワードパスへと変換する、プラグアンドプレイ型の自己蒸留手法SnapFlowを提案する。
  • SnapFlowは学習時に、標準的なフローマッチングサンプルに加えて、「整合性サンプル」を混合する。整合性サンプルは、モデル自身の周辺速度予測から計算した2ステップEulerショートカットのターゲットを用いることで、軌道のドリフトを低減する。
  • ゼロ初期化したターゲット時刻埋め込みにより、同一のアーキテクチャをローカルな速度推定とグローバルな1ステップ生成の間で切り替えられ、外部の教師モデルやアーキテクチャ変更を不要にする。
  • pi0.5(3B)およびSmolVLA(500M)での実験では、待ち時間が大幅に削減されることが示される(例:ノイズ除去の高速化は最大約9.6倍、エンドツーエンドのレイテンシは274msから83msへ)。また、LIBEROタスクにおいて10ステップの教師の成功率と同等、あるいはわずかに上回る。
  • 本アプローチはより長い行動ホライズンに対しても有効であり、レイヤ蒸留やトークン・プルーニングといった他の加速手法とは直交的な位置付けで、組み合わせによる速度向上が可能である。