e-processによるオンラインLLM透かし検出

arXiv stat.ML / 2026/4/13

💬 オピニオンIdeas & Deep AnalysisModels & Research

要点

  • 本論文は、生成トークンと疑似乱数系列の独立性に関する仮説検定として透かし検出をモデル化することで、LLM透かしを検出するための統一的な枠組みを提示している。
  • 固定長のテスト長を事前に決めることなく検出を可能にする、いつでも有効(anytime-valid)な保証を与えるe-processベースのオンライン検定手続きを導入している。
  • 著者らは、検出力を高めるためのe-processの構築に関して、経験的に適応的な方法を提案しており、独立なピボータル統計量を用いるより広い逐次検定設定にも対応している。
  • 本研究では、統計的パワーに関する理論的な特徴づけを行い、既存の透かし検出手法と比べて競争力のある性能を示す実験結果も報告している。

抽象: 大規模言語モデル(LLM)に対するウォーターマーキングは、AIが生成したテキストと人間が書いたコンテンツを区別するための効果的な手段として登場してきた。統計的には、ウォーターマーク方式は生成トークンと擬似ランダム系列の間に依存関係を生じさせ、その結果、ウォーターマーク検出は独立性に関する仮説検定問題へと還元される。我々は、オンライン検定に対していつでも有効な保証(anytime-valid guarantees)を与える、e-process に基づく LLM ウォーターマーク検出のための統一的枠組みを開発する。検出能力を高め得る、経験的に適応的な e-process を構築するための様々な方法を提案する。提案手法は、独立な主要統計量(independent pivotal statistics)が利用可能なあらゆる逐次検定問題に適用できる。さらに、提案手続きのパワー特性を特徴づけるための理論的結果を確立する。いくつかの実験では、提案された枠組みが既存のウォーターマーク検出手法と比較して競争力のある性能を達成することが示されている。