最悪ケースの誤警報(フェルスポジティブ)制約下での、最適なマルチビット生成ウォーターマーキング方式

arXiv cs.CL / 2026/4/13

💬 オピニオンSignals & Early TrendsIdeas & Deep AnalysisModels & Research

要点

  • 本論文は、大規模言語モデルに対するマルチビット生成ウォーターマーキングについて、検出が最悪ケースの誤警報確率制約を満たす必要がある場合を対象に研究する。
  • 既存で提案された方式が、有限トークン(有限長)領域において、先に主張されていた見逃し(ミスディテクション)確率の下限を達成できていないことを示す。
  • 著者らは、新たに2つのエンコード—デコード構成を導入し、それらが確立された下限を達成することを示すことで、ウォーターマーキング性能の最適性を実質的に特徴付ける。
  • ウォーターマーク設計を線形計画法としてモデル化し、最適性が達成可能となるための構造的条件を導出する。
  • 本研究は、なぜ先行構成が失敗するのかを説明し、2つの新たに提案された方式間の実用上のトレードオフを比較する。

要旨: 本論文では、最悪の場合の誤警報(false-alarm)制約の下で、大規模言語モデルに対するマルチビット生成ウォーターマーキングの問題を考察する。先行研究では、有限トークンの領域において達成可能な見逃し(miss-detection)確率の下限を確立し、その下限を達成すると主張された方式を提案した。しかし本研究では、提案方式は実際には劣適(suboptimal)であることを示す。続いて、これまでに確立された下限を達成する2つの新しい符号化‐復号(encoding-decoding)構成を開発し、それにより最適なマルチビット・ウォーターマーキング性能を完全に特徴付ける。提案手法では、ウォーターマーク設計問題を線形計画法として定式化し、最適性を達成し得る構造的条件を導出する。さらに、先行構成における失敗のメカニズムを特定し、提案する2つの方式間のトレードオフを比較する。