実用的なフラクタル: 分割反復関数系としてのノイズ除去拡散

arXiv cs.LG / 2026/3/16

📰 ニュースIdeas & Deep AnalysisModels & Research

共有:

要点

本論文は DDIM の逆拡散過程を Partitioned Iterated Function System (PIFS) として再定義し、拡散モデルのスケジュール、アーキテクチャ、トレーニング目的の統一的な設計言語を提供する。
三つの計算可能な幾何量—各ステップの収縮閾値 L*_t、対角展開関数 f_t(λ)、およびグローバル展開閾値 λ**—を導出し、モデル評価を必要とせずにデノイジングダイナミクスを完全に特徴づける。
PIFS の見方は、二つのレジームに基づくデノイジング挙動を説明する。高ノイズ時には拡散的なクロスパッチ注意によるグローバル文脈の組み立て、低ノイズ時には厳密な分散順序でパッチごとに抑制することによる細部の合成、そして自己注意が自然な収縮の主要な原始として同定される。
解析的には、PIFS アトラクターの Kaplan–Yorke 次元は Lyapunov スペクトルに対する離散モラン方程式を用いて決定され、著者らはこれらの幾何最適化問題の近似解として、コサインスケジュールのオフセット、logSNR シフト、Min-SNR 損失の重み付け、Align Your Steps サンプリングという4つの実用的設計選択が現れることを示す。

Abstract

ノイズを写真に変えるとき、拡散モデルは実際には何をしているのか？私たちは、決定論的な DDIM の逆連鎖が Partitioned Iterated Function System (PIFS) として動作し、このフレームワークがノイズ除去拡散モデルのスケジュール、アーキテクチャ、学習目的の統一設計言語として機能することを示す。PIFS構造から、三つの計算可能な幾何量を導出する：各ステップの収縮閾値

L^*_t

、対角拡張関数

f_t(le)

、およびグローバルな拡張閾値

lambda^{**}

。これらの量はモデル評価を必要とせず、ノイズ除去ダイナミクスを完全に特徴づける。これらは、拡散モデルの二つのレジーム挙動を構造的に説明する：高ノイズ時には拡散的なパッチ間注意を介したグローバルな文脈の組み立て、低ノイズ時には厳密な分散順に従ってパッチごとに抑制を解放することによる微細部の合成。自己注意は PIFS 収縮の自然なプリミティブとして現れる。PIFS アトラクターのカプラン＝ヨーク次元は、リャプノフスペクトル上の離散モラン方程式を通じて解析的に決定される。 PIFS のフラクタル幾何学の研究を通じて、私たちは三つの最適設計基準を導出し、コサインスケジュールのオフセット、解像度依存の logSNR シフト、Min-SNR 損失ウェイティング、Align Your Steps サンプリングという四つの顕著な経験的設計選択が、それぞれ私たちの幾何学的最適化問題の明示的解として現れ、理論を実践へと調整することを示す。

人型ロボットを被災建築物の調査に活用、建築研究所などが公開実験

日経XTECH

「ハード回帰にあらず、デバイスはAIの五感と身体」オムロン技術トップ

日経XTECH

ホンダEV3車種の開発中止、損失はなぜこれほど膨らんだのか

日経XTECH

AIで人月商売はもう終わり、人売りベンダーの技術者は速やかに逃げ出せ

日経XTECH

文書の内容を学習なしでLLMに反映、Sakana AIの新技術 RAG代替は可能か

日経XTECH

実用的なフラクタル: 分割反復関数系としてのノイズ除去拡散

要点

Abstract

関連記事

人型ロボットを被災建築物の調査に活用、建築研究所などが公開実験

「ハード回帰にあらず、デバイスはAIの五感と身体」オムロン技術トップ

ホンダEV3車種の開発中止、損失はなぜこれほど膨らんだのか

AIで人月商売はもう終わり、人売りベンダーの技術者は速やかに逃げ出せ

文書の内容を学習なしでLLMに反映、Sakana AIの新技術 RAG代替は可能か

関連おすすめサービス

Notta搭載AI議事録イヤホン ZENCHORD1

AI搭載ボイスレコーダー Plaud

画像高画質化AIツール Aiarty Image Enhancer