Abstract
拡散モデルは時系列生成において目覚ましい成功を収めています。しかし、推論が遅いことが実運用での導入を制限しています。そこで、本研究では周波数領域の拡散モデルを高速化するために、E^2-CRF(Error-Feedback Event-Driven Cumulative Residual Feature caching)を提案します。本手法は2つの構造的性質を活用します: (1) スペクトル局在性。信号エネルギーが低周波に集中する性質、(2) ミラー対称性。これにより有効な周波数次元が半分になります。E^2-CRFは、拡散ステップ間でトランスフォーマのKV特徴を適応的にキャッシュするクローズドループの誤差フィードバック・システムを用います。固定されたスケジュールではなく、イベント駆動の残差ダイナミクスによって再計算をトリガします。本手法は、高エネルギーまたは急速に変化するトークンを選択的に再計算し、一方で安定した高周波成分に対してはキャッシュ済みの特徴を再利用します。E^2-CRFはサンプル品質を維持しつつ、約2.2倍の速度向上を達成します。5つのデータセットで有効性を示します。キャッシュ戦略は、拡散過程の「構造から詳細へ」という進行に自然に整合します。標準的な正則性の仮定の下で、十分条件としての誤差および複雑度の上界を(付録に)含め、さらに実験的検証も行います。本コードはhttps://github.com/NoakLiu/FastFourierDiffusionで公開されており、https://github.com/NoakLiu/FastCache-xDiTにも統合されています。