拡散サンプリングのためのクエリ下界

arXiv cs.LG / 2026/4/14

📰 ニュースIdeas & Deep AnalysisModels & Research

共有:

要点

本論文は、生成1サンプルあたりに必要なスコア関数評価の回数を減らすことで、拡散モデルのサンプリングを加速することに関する理論的限界を研究する。
拡散サンプリングに対する初めてのスコア・クエリ下界を証明する：多次元（d次元）のターゲットに対して、多項式精度のスコア推定（$\varepsilon = d^{-O(1)}$）を仮定すると、任意のサンプリングアルゴリズムは適応的スコア・クエリを$\tilde{\Omega}(\sqrt{d})$回以上必要とする。
この結果は、サンプラーが$\tilde{\Omega}(\sqrt{d})$個の異なるノイズレベルを実効的に探索することが構造的に必要であることを示唆する。
著者らは、これらの下界を用いて、実用的な拡散サンプラーにおいてマルチスケールのノイズスケジュールが必要であり、単なるヒューリスティックな選択ではない理由を形式的に説明する。

要旨: 拡散モデルは、学習したスコア推定値を反復的に照会することでサンプルを生成する。サンプルリングを加速するために、スコア評価の回数を最小化することに焦点を当てた文献が急速に増えているが、そのような加速の情報理論的限界はなお不明である。
本研究では、拡散サンプリングに対する初めてのスコア照会の下界を確立する。 $d$ 次元の分布に対して、任意の $L^p$ の意味で多項式精度のスコア推定値 $=d^{-O(1)}$ へのアクセスが与えられると、任意のサンプリングアルゴリズムは、適応的なスコア照会を $()$ （すなわち $ilde{}$ ）回、少なくとも $ilde{}O()$ が必要であることを証明する。特に本証明は、任意のサンプラーが $ilde{}O()$ 個の異なるノイズ水準を探索しなければならないことを示し、実際にマルチスケールのノイズスケジュールが必要となる理由を形式的に説明する。

テスラのE2E自動運転技術FSD、オランダ承認「欧州初」一般道で手放し

日経XTECH

リコーのマルチモーダルAI、図面から寸法を読み出し普通公差を適用

日経XTECH

ソフトバンクなど3社、フィジカルAIへの通信ロボとMECの連係が鍵

日経XTECH

SBGの特許が2年連続1万件超公開、AIが変えた「発明」のつくり方

日経XTECH

新卒ビジネス職を1カ月で技術者へ転換、TOKIUM AI時代は皆「越境人材」

日経XTECH

拡散サンプリングのためのクエリ下界

要点

関連記事

テスラのE2E自動運転技術FSD、オランダ承認「欧州初」一般道で手放し

リコーのマルチモーダルAI、図面から寸法を読み出し普通公差を適用

ソフトバンクなど3社、フィジカルAIへの通信ロボとMECの連係が鍵

SBGの特許が2年連続1万件超公開、AIが変えた「発明」のつくり方

新卒ビジネス職を1カ月で技術者へ転換、TOKIUM AI時代は皆「越境人材」

関連おすすめサービス

Notta搭載AI議事録イヤホン ZENCHORD1

AI搭載ボイスレコーダー Plaud

画像高画質化AIツール Aiarty Image Enhancer

要点

関連記事

テスラのE2E自動運転技術FSD、オランダ承認 「欧州初」一般道で手放し

リコーのマルチモーダルAI、図面から寸法を読み出し普通公差を適用

ソフトバンクなど3社、フィジカルAIへの通信 ロボとMECの連係が鍵

SBGの特許が2年連続1万件超公開、AIが変えた「発明」のつくり方

新卒ビジネス職を1カ月で技術者へ転換、TOKIUM AI時代は皆「越境人材」

関連おすすめサービス

Notta搭載AI議事録イヤホン ZENCHORD1

AI搭載ボイスレコーダー Plaud

画像高画質化AIツール Aiarty Image Enhancer

テスラのE2E自動運転技術FSD、オランダ承認「欧州初」一般道で手放し

ソフトバンクなど3社、フィジカルAIへの通信ロボとMECの連係が鍵