CSGuard:圧縮センシング制約による拡散モデルの偽造耐性ウォーターマーキング

arXiv cs.CV / 2026/5/5

📰 ニュースModels & Research

要点

  • 潜在空間(latent space)へのウォーターマーキングを用いる拡散モデルは追加学習なしでコンテンツの帰属(アトリビューション)を可能にしますが、既存手法には「偽造(forgery)」攻撃に対する重大な脆弱性があります。
  • 本論文では、秘密行列に結び付いた圧縮センシング制約を用いて、生成と検証を強く結び付ける「CSGuard」という偽造耐性ウォーターマーキング方式を提案します。
  • CSGuardでは、秘密行列を持つ正規ユーザーのみがウォーターマークの埋め込み/検証を正しく行えるため、認可されていないユーザーによる偽造がより困難になります。
  • 実験により、偽造攻撃の成功率が100.0%から28.12%へ低下し、良性ウォーターマーク画像の検出率は100%を維持しつつ、ウォーターマーキング効果を損なわないことが示されています。

Abstract

潜在表現ベースの拡散モデルによるウォーターマーキングは、生成画像の潜在空間に透かしを埋め込むことでコンテンツの帰属を可能にし、知的財産保護とデジタルフォレンジックのための学習不要の解決策を提供する。しかし、これらの手法には、偽造攻撃に対する致命的な脆弱性がある。攻撃者は、透かしの入った画像を反転(inverting)し、任意のプロンプトで再生成することで透かしを抽出でき、その結果、悪意のあるコンテンツに対して誤った帰属を可能にする。本論文では、圧縮センシングを用いて透かし付き画像の生成と検証を秘密行列に結び付ける、最初の偽造耐性を備えたウォーターマーキング方式であるCSGuardを提案する。これにより、秘密行列を保持するユーザのみが画像の透かしを正しく埋め込み/検証できるようにし、生成品質やウォーターマークの完全性を損なうことなく、不正なユーザによる偽造を防止する。実験結果は、CSGuardが強い偽造耐性を達成し、攻撃成功率を100.0\%から28.12\%へ低減し、さらに、良性の透かし付き画像に対して透かしの有効性を損なうことなく検出率100\%を達成することを示している。

CSGuard:圧縮センシング制約による拡散モデルの偽造耐性ウォーターマーキング | AI Navigate