エラーフィードバック付きイベント駆動キャッシュによる周波数領域拡散モデルの高速化

arXiv cs.LG / 2026/4/28

📰 ニュースDeveloper Stack & InfrastructureSignals & Early TrendsModels & Research

要点

  • 本論文は、時系列生成に用いられる周波数領域拡散モデルを高速化するために、エラーフィードバック型のイベント駆動キャッシュ方式E²-CRFを提案しており、実用上のボトルネックとなっている推論の遅さを改善することを狙っています。
  • E²-CRFは、(1) スペクトル局在(信号エネルギーが低周波に集中する)と、(2) 鏡映対称性(有効な周波数次元を半分にできる)という2つの構造的性質を活用し、重複計算を削減します。
  • 閉ループのエラーフィードバックにより拡散ステップ間でトランスフォーマのKV特徴を適応的にキャッシュし、固定スケジュールではなく残差ダイナミクスに基づくイベント駆動で再計算をトリガーします。
  • エネルギーが高い、または残差が急速に変化するトークンは選択的に再計算し、安定した成分についてはキャッシュを再利用することで、サンプル品質を維持しつつ約2.2倍の高速化を達成します。
  • 5つのデータセットでの実験と、(標準的な正則性仮定のもとで)誤差・計算量に関する十分条件の理論的評価に加え、コード公開と関連リポジトリへの統合も行われています。

Abstract

拡散モデルは時系列生成において目覚ましい成功を収めています。しかし、推論が遅いことが実運用での導入を制限しています。そこで、本研究では周波数領域の拡散モデルを高速化するために、E^2-CRF(Error-Feedback Event-Driven Cumulative Residual Feature caching)を提案します。本手法は2つの構造的性質を活用します: (1) スペクトル局在性。信号エネルギーが低周波に集中する性質、(2) ミラー対称性。これにより有効な周波数次元が半分になります。E^2-CRFは、拡散ステップ間でトランスフォーマのKV特徴を適応的にキャッシュするクローズドループの誤差フィードバック・システムを用います。固定されたスケジュールではなく、イベント駆動の残差ダイナミクスによって再計算をトリガします。本手法は、高エネルギーまたは急速に変化するトークンを選択的に再計算し、一方で安定した高周波成分に対してはキャッシュ済みの特徴を再利用します。E^2-CRFはサンプル品質を維持しつつ、約2.2倍の速度向上を達成します。5つのデータセットで有効性を示します。キャッシュ戦略は、拡散過程の「構造から詳細へ」という進行に自然に整合します。標準的な正則性の仮定の下で、十分条件としての誤差および複雑度の上界を(付録に)含め、さらに実験的検証も行います。本コードはhttps://github.com/NoakLiu/FastFourierDiffusionで公開されており、https://github.com/NoakLiu/FastCache-xDiTにも統合されています。