広告

拡散を容易にするためにストロークサイズ(筆致サイズ)を変更できるか?

arXiv cs.CV / 2026/3/31

💬 オピニオンSignals & Early TrendsIdeas & Deep AnalysisModels & Research

要点

  • 本論文は、拡散モデルを低い信号対雑音比(SNR)設定で改善できるかどうかを、「ストロークサイズ制御」によって、拡散の各タイムステップにおいてモデルがデータをどのように狙い、どのように摂動(撹乱)を加えるかを調整することで検討する。
  • 提案手法は、幾何学的直観によって動機づけられている。すなわち、ノイズが支配的なときに、過度に細かい「ストローク」(すなわち、過度に粒度の高いピクセルレベルの予測)を用いても効果が得られない可能性がある。
  • 著者らは、高いノイズ下でのピクセルレベル予測の負担を軽減することを目指し、教師ありターゲットの「実効的な粗さ」を変えることの理論的・実証的な利点とトレードオフを分析している。
  • 著者らは、再現とさらなる実験を可能にするため、ストロークサイズアプローチのコードを公開する予定であることを示している。

Abstract

拡散モデルは、信号対雑音比(SNR)が低い状況では挑戦を受けることがあります。この状況では、高いノイズが存在するにもかかわらず、ピクセルレベルの予測を行わなければなりません。幾何学的な直感としては、油絵を描く際に常に最も細い筆致を用いるようなもので、効果的でない可能性があります。そこで本研究では、低SNRの課題を緩和することを試みるために、制御された介入として「筆致サイズ制御」を検討します。この介入は、教師ありターゲットの実効的な粗さ、予測、そしてタイムステップ間の摂動を変更し得ます。介入の利点とトレードオフを、理論的および実証的の両面から分析します。コードは公開予定です。

広告