Stream-R1:ストリーミング動画生成における信頼性・パープレキシティを意識したリワード蒸留
arXiv cs.CV / 2026/5/6
📰 ニュースIdeas & Deep AnalysisModels & Research
要点
- この論文は、ストリーミング動画拡散モデル向けの蒸留(分布整合蒸留:DMD)が、ロールアウト・フレーム・ピクセルのすべての教師出力を同じ信頼度の監督として扱ってしまうため、品質が頭打ちになると主張しています。
- Stream-R1では、蒸留損失の重み付けを2つの軸で再設計します。1つ目はInter-Reliability(学習ロールアウト間の信頼性)で、事前学習済みの動画リワードスコアを指数関数で用いて、信頼できる監督が最適化を支配するようにします。2つ目はIntra-Perplexity(空間・時間領域内の寄与の違い)で、同じリワードモデルからピクセル単位の勾配サリエンシを取り出し、空間/時間の重みとして最適化の集中先を決めます。
- さらに、共有されたリワード誘導メカニズムにより、視覚品質・運動品質・テキスト整合といった品質軸のうち特定の軸だけが過度に支配しないよう適応的なバランスを行います。
- 実験では、標準的なストリーミング動画生成ベンチマークにおいて蒸留ベースラインより3つの品質次元すべてで一貫した改善が示され、アーキテクチャ変更や追加の推論コストは不要とされています。



