SnapFlow：進行的自己蒸留によるフローマッチングVLAの1ステップ行動生成

arXiv cs.CV / 2026/4/8

📰 ニュースSignals & Early TrendsIdeas & Deep AnalysisModels & Research

原文を読む →

共有:

要点

本論文は、フローマッチングVLAモデルが通常行う多段階の反復的ノイズ除去を、1ステップ行動生成（1-NFE）のための単一のフォワードパスへと変換する、プラグアンドプレイ型の自己蒸留手法SnapFlowを提案する。
SnapFlowは学習時に、標準的なフローマッチングサンプルに加えて、「整合性サンプル」を混合する。整合性サンプルは、モデル自身の周辺速度予測から計算した2ステップEulerショートカットのターゲットを用いることで、軌道のドリフトを低減する。
ゼロ初期化したターゲット時刻埋め込みにより、同一のアーキテクチャをローカルな速度推定とグローバルな1ステップ生成の間で切り替えられ、外部の教師モデルやアーキテクチャ変更を不要にする。
pi0.5（3B）およびSmolVLA（500M）での実験では、待ち時間が大幅に削減されることが示される（例：ノイズ除去の高速化は最大約9.6倍、エンドツーエンドのレイテンシは274msから83msへ）。また、LIBEROタスクにおいて10ステップの教師の成功率と同等、あるいはわずかに上回る。
本アプローチはより長い行動ホライズンに対しても有効であり、レイヤ蒸留やトークン・プルーニングといった他の加速手法とは直交的な位置付けで、組み合わせによる速度向上が可能である。

Black Hat Asia

AI Business

新規会員登録

AI-SCHOLAR

#生成AI (304,168)

note

今すぐ会員登録（無料）

日経XTECH

人型ロボット、中国が圧倒的に先行日本はコア部品技術で挽回へ

日経XTECH

SnapFlow：進行的自己蒸留によるフローマッチングVLAの1ステップ行動生成

要点

関連記事

Black Hat Asia

新規会員登録

#生成AI (304,168)

今すぐ会員登録（無料）

人型ロボット、中国が圧倒的に先行日本はコア部品技術で挽回へ

関連おすすめサービス

Notta搭載AI議事録イヤホン ZENCHORD1

AI搭載ボイスレコーダー Plaud

画像高画質化AIツール Aiarty Image Enhancer

要点

関連記事

Black Hat Asia

新規会員登録

#生成AI (304,168)

今すぐ会員登録（無料）

人型ロボット、中国が圧倒的に先行 日本はコア部品技術で挽回へ

関連おすすめサービス

Notta搭載AI議事録イヤホン ZENCHORD1

AI搭載ボイスレコーダー Plaud

画像高画質化AIツール Aiarty Image Enhancer

人型ロボット、中国が圧倒的に先行日本はコア部品技術で挽回へ