広告

Gaussian Shannon:通信に基づく高精度拡散モデルのウォーターマーキング

arXiv cs.CV / 2026/3/30

💬 オピニオンIdeas & Deep AnalysisTools & Practical UsageModels & Research

要点

  • 本論文では、拡散過程をノイズのある通信チャネルとしてモデル化する「Gaussian Shannon」という拡散モデルのウォーターマーキング枠組みを提案し、埋め込んだウォーターマークのロバストな追跡と、ペイロードのビットレベルでの正確な復元の両方を可能にします。
  • 閾値ベースの検出器のように曖昧な照合しかできないのとは異なり、本手法はウォーターマークを初期のガウス雑音へ直接埋め込み、ライセンス指示のような用途に用いるための、ビット完全(bit-exact)でロスレスな形での構造化メタデータの回復を目指します。
  • 干渉を局所的なビット反転と大域的な確率的歪みとして分析し、そのうえで、誤り訂正符号と多数決(majority voting)を組み合わせたカスケード型の防御を適用することで、信頼性の高いエンドツーエンドのペイロード伝送を実現します。
  • 複数のStable Diffusion系バリアントと多様な摂動に対する実験では、微調整なしで画質を維持しつつ、最先端のビット精度と高い真陽性率が報告されています。
  • 著者らは、リンクされたGitHubリポジトリを通じてオープンソース実装を提供しています。

要旨: 拡散モデルは高品質な画像を生成する一方で、著作権侵害や偽情報といった深刻なリスクをもたらします。ウォーターマーキングは、AI生成コンテンツを追跡し真正性を認証するための重要な防御策です。しかし、既存の手法は閾値ベースの検出に依存しているため、曖昧な照合しか可能でなく、構造化されたウォーターマークデータをビット単位で完全に復元することはできません。その結果、オフライン検証や、損失のないメタデータを必要とするアプリケーション(例:ライセンス指示)には不適切です。そこで本論文では、拡散過程をノイズのある通信チャネルとして扱うウォーターマーキングの枠組み「Gaussian Shannon」を提案し、頑健な追跡と正確なビット復元の両方を可能にします。本手法は、微調整や画質の低下なしに、初期のガウス雑音にウォーターマークを埋め込みます。チャネル干渉には、局所的なビット反転と、全体的な確率的歪みの2種類があることを特定し、誤り訂正符号と多数決によるカスケード型の防御を設計します。これにより、意味ペイロードのエンドツーエンドでの信頼できる伝送を保証します。3つのStable Diffusionの各バリアントと7種類の摂動タイプにまたがる実験の結果、Gaussian Shannonは高い真陽性率を維持しつつ、ビットレベルでの最先端の精度を達成し、実環境での導入において信頼できる権利帰属を可能にします。ソースコードは以下で公開されています: https://github.com/Rambo-Yi/Gaussian-Shannon

広告