ブロック単位のコードワード埋め込みによる信頼性の高いマルチビット・テキスト透かし

arXiv cs.CL / 2026/5/4

📰 ニュースIdeas & Deep AnalysisModels & Research

共有:

要点

本論文は、LLM向けの既存のマルチビット・テキスト透かし手法が容量を重視しすぎ、検出と復号を混同してしまうため検証が不安定になると指摘している。
ECCベースの抽出器では壊滅的な誤検出（FPR）が起きうること、さらに拒否閾値の調整だけでは真陽性（TPR）がランダムに近い水準へ落ちることを示している。
著者らは、復号中心の設計ではなく「指定された検証（designated verification）」に基づく枠組みとして、BREW（Block-wise Reliable Embedding for Watermarking）を提案している。
BREWは2段階で動作し、(i) ブロックごとの投票によるブラインドなメッセージ推定と、(ii) 埋め込まれたペイロードが局所編集に耐えるかを厳密に検証するウィンドウ・シフト検証を行う。
実験では、同義語置換10%まででTPR=0.965、FPR=0.02という高い信頼性を報告し、モデル非依存で法科学用途にスケール可能だと主張している。

Abstract

大規模言語モデル（LLM）に対する最近のマルチビット・ウォーターマーキング手法は、信頼性よりも容量を優先し、しばしばデコードと検出を混同しています。我々の分析では、既存のECCベース抽出器が壊滅的な偽陽性率（FPR）を抱えていること、そして棄却閾値を適用するだけでは検出感度（TPR）がランダムな推測へと崩れ落ちることが明らかになりました。この構造上の制約を解決するために、我々は \textbf{BREW}（Block-wise Reliable Embedding for Watermarking）を提案します。これは、 \emph{指定された検証（designated verification）} へとパラダイムを転換する枠組みです。BREWは、二段階の仕組みを採用します：（i）独立したブロック投票による\textbf{ブラインド・メッセージ推定}、その後に（ii）ローカルな編集に対してペイロードを厳密に検証する\textbf{ウィンドウ・シフティング検証}。実験により、BREWは、10\%の同義語置換下で、FPRが0.02でありながらTPRが0.965を達成することを示します。これは、高いFPRの問題が、マルチビット・ウォーターマーキングに固有のトレードオフではなく、先行するデコード中心の設計に起因する解決可能な構造的欠陥であることを示しています。我々の枠組みはモデルに依存せず、理論的に裏付けられており、信頼できるフォレンジック展開に向けたスケーラブルな解決策を提供します。