RBF-Solver: 放射基底関数を用いた拡散確率モデルの多段階サンプラー

arXiv cs.LG / 2026/3/17

📰 ニュースModels & Research

共有:

要点

本論文は、ガウス型放射基底関数を用いてモデル評価を補間し、最適なサンプリング軌跡に従うよう形状パラメータを学習する、多段階の拡散サンプラーである RBF-Solver を提案する。
一階のとき、RBF-Solver はオイラー法（DDIM）へ還元され、形状パラメータが無限大に近づくと Adams 法へ収束し、既存のサンプラーとの互換性を確保する。
ガウス型放射基底関数は局所的であるため、RBF-Solver は第四次以上の高階でも画質の忠実度を維持し、従来の多項式ベースのサンプラーが劣化する領域を回避する。
経験的には、Score-SDE を用いた CIFAR-10 で 15 回の関数評価時に FID が 2.87、40 回の評価時に 2.48 を達成する；条件付き ImageNet 256×256 で Guided Diffusion によるガイダンス 8.0 の場合、低 NFE 範囲（5–10）で顕著な改善を示し、多項式ベースのサンプラーに対して FID を 16.12–33.73% 削減する。
結果は、無条件および条件付き生成設定の両方において、拡散モデルのサンプリング効率と画質を向上させる幅広い適用性を示唆している。

概要: 拡散確率モデル（DPM）は卓越した生成忠実度のため広く採用されているが、そのサンプリングは計算コストが高い。多項式ベースの多段サンプラーは推論を高速化することでこのコストを緩和するが、理論的な精度保証にもかかわらず、事前に定義されたスキームに従ってサンプリング軌道を生成し、さらなる最適化の柔軟性を提供しない。この制限に対処するため、ガウス型ラジアル基底関数（RBF）を用いてモデル評価を補間する多段拡散サンプラーである RBF-Solver を提案する。ガウス型ラジアル基底関数の学習可能な形状パラメータを活用することにより、RBF-Solver は明示的に最適なサンプリング軌道に従う。一次では、それはオイラー法（DDIM）に縮約される。二次以上では、形状パラメータが無限大に近づくにつれて、RBF-Solver はアダムス法へ収束し、既存のサンプリャーとの互換性を確保する。ガウス型ラジアル基底関数の局所性のおかげで、RBF-Solver は第四次以上の高階でも高い画像忠実度を維持し、従来のサンプラーが劣化する領域でも性能を保つ。無条件生成では、RBF-Solver は高 NFE レジーム（NFE >= 15）において一貫して多項式ベースのサンプラーを上回る。Score-SDE モデルを用いた CIFAR-10 において、15 回の関数評価で FID 2.87 を達成し、40 回の関数評価でさらに 2.48 に改善される。Guided Diffusion モデルを用いた 8.0 のガイダンススケールによる条件付き ImageNet 256 x 256 生成では、低 NFE 範囲（5-10）で有意な利得が得られ、多項式ベースのサンプラーに対して FID が 16.12〜33.73% 減少する。

仕様駆動開発における自己改良エージェント

Dev.to

誰かこれを試したことはありますか？ Flash-MoE: ノートパソコンで3,970億パラメータのモデルを動かす

Reddit r/LocalLLaMA

M2.7のオープンウェイト、約2週間で公開予定

Reddit r/LocalLLaMA

MiniMax M2.7 ウェイト公開予定

Reddit r/LocalLLaMA

Claude Codeに最適なオープンソースのコーディングモデルは？LB?

Reddit r/LocalLLaMA

RBF-Solver: 放射基底関数を用いた拡散確率モデルの多段階サンプラー

要点

関連記事

仕様駆動開発における自己改良エージェント

誰かこれを試したことはありますか？ Flash-MoE: ノートパソコンで3,970億パラメータのモデルを動かす

M2.7のオープンウェイト、約2週間で公開予定

MiniMax M2.7 ウェイト公開予定

Claude Codeに最適なオープンソースのコーディングモデルは？LB?

関連おすすめサービス

Notta搭載AI議事録イヤホン ZENCHORD1

AI搭載ボイスレコーダー Plaud

画像高画質化AIツール Aiarty Image Enhancer