拡散モデルにおけるシャドウ・タイムステップ埋め込みによる情報注入

arXiv cs.LG / 2026/5/5

📰 ニュースSignals & Early TrendsIdeas & Deep AnalysisModels & Research

共有:

要点

本論文は、拡散モデルにおけるタイムステップ埋め込み（ノイズ除去のための時間条件付け）には、隠れた情報を保持し得るにもかかわらず、これまでセキュリティ面での検討が十分でないと指摘しています。
「Shadow Timestep Embedding (STE)」を提案し、タイムステップ埋め込みの「時間空間」を通じて悪意あるサイドチャネル情報を注入できるかを調査します。
タイムステップごとに表現能力が異なり、サイドチャネル情報を符号化できることを示しています。
符号化された情報は、拡散パイプラインのスケジューラ・インターフェースを通じて、攻撃と防御の両方に利用できると論じています。
タイムステップ埋め込みを位置エンコーディング写像として捉え、相互コヒーレンスを用いて、異なるタイムステップ区間が分離可能である理由を説明する理論解析を提供しています。

Abstract

拡散モデルは現代の生成システムの基盤となっており、ほとんどの研究は生成効率と出力品質の向上に主として焦点を当ててきました。タイムステップ埋め込み（timestep embedding）成分は拡散パイプラインの重要な一部であり、復元（denoising）ネットワークに時間的な条件付け信号を与えることで、処理の過程を通じて異なるノイズレベルにわたってその予測を適応させることを可能にします。多大な情報を含み得るにもかかわらず、タイムステップ埋め込みは、特にセキュリティリスクや信頼できるプロベナンス（provenance）に関して、現在の研究では十分に調べられていません。このギャップを埋めるために、本論文ではShadow Timestep Embedding（STE）を提案します。STEは、拡散モデルへの悪意ある情報注入のために未活用の時間的空間を調査する新しい仕組みです。具体的には、タイムステップ埋め込み空間を拡大して見ると、異なるタイムステップが側面（サイドチャネル）情報を符号化し得る、異なる表現能力を示すことが分かります。さらに、こうして符号化された情報は、スケジューラ・インターフェースを通じて攻撃および防御の目的に利用できます。タイムステップ埋め込みを位置エンコーディング（position-encoding）の写像として理論的に解析し、分離可能な（交わりのない）タイムステップ区間の切り離し（separability）を説明する相互コヒーレンス（mutual coherence）の評価式を導出します。本研究の結果は、拡散モデルのタイムステップが、専用の情報を運ぶ強力なサイドチャネルであることを示しており、時間次元を理解することで敵対的（adversarial）生成モデリングの新たな方向性を動機づけます。