ソフト異方性ダイアグラムによる微分可能な画像表現

arXiv cs.CV / 2026/4/27

📰 ニュースDeveloper Stack & InfrastructureSignals & Early TrendsTools & Practical UsageModels & Research

要点

  • 本論文は、学習可能なサイトに基づき、異方性メトリックと加法的に重み付けされた距離スコアで定義される、明示的かつ微分可能な画像表現「Soft Anisotropic Diagrams(SAD)」を提案する。
  • SADでは、各画素の色を、近傍サイトの小さなtop-K集合に対するソフトマックスによるブレンドで計算し、学習可能な温度を伴うソフトな異方性加法的重み付きボロノイ(アポロニウス)分割を形成して、有用な勾配を保ちながら明瞭で内容に整合した境界と所有関係を得る。
  • GPUに適した効率として、固定サイズの局所計算を用い、同一のシェーディングスコア下での最近傍を近似するper-query top-Kマップを使うことでレンダリングを高速化し、更新はjump floodingに着想したtop-K伝播に加えて確率的なグローバル被覆のための確率的注入を組み合わせる。
  • 実験では、SADはビットレートを揃えた条件でImage-GSやInstant-NGPを上回り、Kodakで46.0 dBのPSNRを2.2秒の符号化時間で達成し、Image-GS(28秒)より大幅に短縮している。
  • SADは、微分可能な順問題・逆問題のパイプラインへのシームレスな統合、速いランダムアクセス、コンパクトな保存性の面でも有効性が示されている。

Abstract

Soft Anisotropic Diagrams(SAD)を導入します。SADは、画像平面上の一連の適応的なサイトによってパラメータ化された、明示的かつ微分可能な画像表現です。SADでは、各サイトが異方的なメトリックと、加法的に重み付けされた距離スコアを指定し、ピクセルの色は、サイトの小さなピクセルごとの上位K(top-K)部分集合に対するsoftmaxブレンドとして計算します。学習可能な各サイトの温度によって、ソフトな異方的加法的ウェイト付きVoronoi分割(すなわちApollonius図)を誘導し、情報量の多い勾配を保持しつつ、明確でコンテンツに整合した境界と明示的な所有関係を可能にします。このような定式化により、同一のシェーディングスコアのもとで最近傍を近似する、問い合わせごとのtop-Kマップを維持することで効率的なレンダリングが可能になり、GPUフレンドリーで固定サイズのローカル計算を実現します。私たちはjump floodingに着想を得たtop-K伝播スキームでこのリストを更新し、確率的なグローバルなカバレッジを提供するために確率的な注入(stochastic injection)を加えます。訓練は、GPU-firstのパイプラインに従い、勾配重み付きの初期化、Adamによる最適化、そしてデンサイフィケーション(densification)とプルーニング(pruning)による適応的な予算管理を行います。標準ベンチマークにおいて、SADは一致したビットレート条件でImage-GSとInstant-NGPの両方を一貫して上回ります。Kodakでは、SADは2.2秒のエンコーディング時間で46.0 dBのPSNRを達成します(Image-GSは28秒)。さらに、最先端のベースラインに対して、エンドツーエンドの学習速度を4〜19倍向上させます。SADの有効性は、順問題と逆問題のための微分可能パイプラインとのシームレスな統合、迅速なランダムアクセスの効率、そしてコンパクトなストレージにより示します。