除去攻撃および偽造攻撃に対して頑健なコンテンツ透かしに向けて

arXiv cs.CV / 2026/4/9

💬 オピニオンIdeas & Deep AnalysisModels & Research

要点

  • 本論文は、テキストから画像への拡散モデルに対する既存のコンテンツ透かし手法の脆弱性、特に除去攻撃および偽造攻撃への耐性に焦点を当てる。
  • 提案する新しいパラダイムは、Instance-Specific watermarking with Two-Sided detection(ISTS)であり、ユーザーのプロンプトの意味論に基づいて透かしの注入時刻とパターンを動的に調整する。
  • 著者らは、防御的な条件下での透かし検出の頑健性を高めることを目的とした、二方向検出手法を導入する。
  • 実験結果から、提案するISTS手法は、除去攻撃および偽造攻撃にさらした場合に、従来の透かし手法よりも優れた性能を示すことが分かる。

Abstract

生成されたコンテンツは、著作権保護、画像の由来(プロベナンス)、およびクレジット(功績)帰属に関して深刻な懸念を引き起こしてきました。これらの問題に対する潜在的な解決策の一つがウォーターマーキングです。近年、テキストから画像への拡散モデルに対するコンテンツウォーターマーキングは、その効果的な検出機能と頑健性(ロバスト性)により、広く研究されてきました。しかし、これらのウォーターマーキング技術は、除去攻撃や偽造攻撃のような潜在的な敵対的攻撃に対して脆弱です。本論文では、除去攻撃および偽造攻撃に耐性を持つために、Instance-Specific watermarking with Two-Sided detection(ISTS)と呼ぶ新しいウォーターマーキングのパラダイムを構築します。具体的には、ユーザのプロンプトの意味(セマンティクス)に基づいて、注入のタイミングとウォーターマーキングのパターンを動的に制御する戦略を導入します。さらに、ウォーターマーキング検出の頑健性を高めるための新しい二面(ツーサイド)検出アプローチを提案します。実験により、提案するウォーターマーキングが除去攻撃および偽造攻撃に対して優れていることが示されました。