TRACE: 構造を意識した文字エンコーディングによる堅牢で汎用的な文書ウォーターマーキング

arXiv cs.CV / 2026/3/16

📰 ニュースIdeas & Deep AnalysisModels & Research

共有:

要点

TRACEは、文字レベルでデータをエンコードすることにより、堅牢で汎用的な文書ウォーターマーキングを実現する構造を意識した拡散ベースのフレームワークを提案します。
これは、ハンドル点、ターゲット点、および編集領域を識別するための移動確率推定器（MPE）、ターゲット点推定（TPE）、マスク描画モデル（MDM）を用いた適応的拡散初期化を含みます。
選択された点の移動とマスク領域の置換を、拡散後の特徴変化を最小化する特殊な損失で導くガイド付き拡散エンコーディングを採用します。
実験結果は、5 dBを超えるPSNRの改善と、異なるメディア間の伝送後に約5％の抽出精度向上を示し、最先端の手法を上回っています。
このアプローチは複数の言語とフォントにまたがって一般化され、実世界の文書セキュリティアプリケーションの実用性を高めます。

要旨: TRACEは、データを埋め込むための局所的な文字エンコードを実現する、拡散モデルを活用した構造認識フレームワークです。エッジ特徴や事前定義されたコードブックに依存する従来の手法とは異なり、TRACEは安定性と多様な文字間での統一表現によってノイズ干渉に対する固有の耐性を提供する文字構造を活用します。私たちのフレームワークは3つの主要な要素から成ります：（1）自動的にハンドル点、ターゲット点、および編集領域を識別する適応拡散初期化。これは、移動確率推定器（MPE）、ターゲット点推定（TPE）およびマスク描画モデル（MDM）を含む専門的なアルゴリズムを用いて行われます、（2）選択された点の正確な移動のためのガイド付き拡散エンコーディング、（3）拡散プロセス後の特徴変化を最小化する専用の損失関数を用いたマスク領域の置換。包括的な実験は、
ame{} の従来手法に対する優れた性能を示し、PSNRで5 dBを超える改善と、クロスメディア伝送後の抽出精度が5％向上します。
ame{} は複数の言語とフォントにわたって広い一般化性を達成し、実用的な文書セキュリティアプリケーションに特に適しています。