最悪ケースの誤警報（フェルスポジティブ）制約下での、最適なマルチビット生成ウォーターマーキング方式

arXiv cs.CL / 2026/4/13

💬 オピニオンSignals & Early TrendsIdeas & Deep AnalysisModels & Research

共有:

要点

本論文は、大規模言語モデルに対するマルチビット生成ウォーターマーキングについて、検出が最悪ケースの誤警報確率制約を満たす必要がある場合を対象に研究する。
既存で提案された方式が、有限トークン（有限長）領域において、先に主張されていた見逃し（ミスディテクション）確率の下限を達成できていないことを示す。
著者らは、新たに2つのエンコード—デコード構成を導入し、それらが確立された下限を達成することを示すことで、ウォーターマーキング性能の最適性を実質的に特徴付ける。
ウォーターマーク設計を線形計画法としてモデル化し、最適性が達成可能となるための構造的条件を導出する。
本研究は、なぜ先行構成が失敗するのかを説明し、2つの新たに提案された方式間の実用上のトレードオフを比較する。

要旨: 本論文では、最悪の場合の誤警報（false-alarm）制約の下で、大規模言語モデルに対するマルチビット生成ウォーターマーキングの問題を考察する。先行研究では、有限トークンの領域において達成可能な見逃し（miss-detection）確率の下限を確立し、その下限を達成すると主張された方式を提案した。しかし本研究では、提案方式は実際には劣適（suboptimal）であることを示す。続いて、これまでに確立された下限を達成する2つの新しい符号化‐復号（encoding-decoding）構成を開発し、それにより最適なマルチビット・ウォーターマーキング性能を完全に特徴付ける。提案手法では、ウォーターマーク設計問題を線形計画法として定式化し、最適性を達成し得る構造的条件を導出する。さらに、先行構成における失敗のメカニズムを特定し、提案する2つの方式間のトレードオフを比較する。