e-processによるオンラインLLM透かし検出

arXiv stat.ML / 2026/4/13

💬 オピニオンIdeas & Deep AnalysisModels & Research

共有:

要点

本論文は、生成トークンと疑似乱数系列の独立性に関する仮説検定として透かし検出をモデル化することで、LLM透かしを検出するための統一的な枠組みを提示している。
固定長のテスト長を事前に決めることなく検出を可能にする、いつでも有効（anytime-valid）な保証を与えるe-processベースのオンライン検定手続きを導入している。
著者らは、検出力を高めるためのe-processの構築に関して、経験的に適応的な方法を提案しており、独立なピボータル統計量を用いるより広い逐次検定設定にも対応している。
本研究では、統計的パワーに関する理論的な特徴づけを行い、既存の透かし検出手法と比べて競争力のある性能を示す実験結果も報告している。

抽象: 大規模言語モデル（LLM）に対するウォーターマーキングは、AIが生成したテキストと人間が書いたコンテンツを区別するための効果的な手段として登場してきた。統計的には、ウォーターマーク方式は生成トークンと擬似ランダム系列の間に依存関係を生じさせ、その結果、ウォーターマーク検出は独立性に関する仮説検定問題へと還元される。我々は、オンライン検定に対していつでも有効な保証（anytime-valid guarantees）を与える、e-process に基づく LLM ウォーターマーク検出のための統一的枠組みを開発する。検出能力を高め得る、経験的に適応的な e-process を構築するための様々な方法を提案する。提案手法は、独立な主要統計量（independent pivotal statistics）が利用可能なあらゆる逐次検定問題に適用できる。さらに、提案手続きのパワー特性を特徴づけるための理論的結果を確立する。いくつかの実験では、提案された枠組みが既存のウォーターマーク検出手法と比較して競争力のある性能を達成することが示されている。

💡 この記事が使われたインサイト

AIの最新ニュースをまとめた「今日の要点」で、この記事が取り上げられています。

📅 4/13Dailyインサイトを見る →

ロボット用フィジカルAIのVLAがサブミリ精度獲得、Physical Intelligenceがオンライン強化学習で

日経XTECH

日立やNEC、フィジカルAIで脱「人月商売」／AIエージェント時代に台頭する「FDE」など、注目記事を音声化

日経XTECH

注目集める「AIエージェント」、一問一答型から自律的なシステムに

日経XTECH

新モデル「Claude Mythos」の衝撃数千の脆弱性を発見、一般公開せず

日経XTECH

「対応せざるを得ない」、Anthropicの「Mythos」に身構える日本の金融業界

日経XTECH

e-processによるオンラインLLM透かし検出

要点

💡 この記事が使われたインサイト

関連記事

ロボット用フィジカルAIのVLAがサブミリ精度獲得、Physical Intelligenceがオンライン強化学習で

日立やNEC、フィジカルAIで脱「人月商売」／AIエージェント時代に台頭する「FDE」など、注目記事を音声化

注目集める「AIエージェント」、一問一答型から自律的なシステムに

新モデル「Claude Mythos」の衝撃数千の脆弱性を発見、一般公開せず

「対応せざるを得ない」、Anthropicの「Mythos」に身構える日本の金融業界

関連おすすめサービス

Notta搭載AI議事録イヤホン ZENCHORD1

AI搭載ボイスレコーダー Plaud

画像高画質化AIツール Aiarty Image Enhancer

要点

💡 この記事が使われたインサイト

関連記事

ロボット用フィジカルAIのVLAがサブミリ精度獲得、Physical Intelligenceがオンライン強化学習で

日立やNEC、フィジカルAIで脱「人月商売」／AIエージェント時代に台頭する「FDE」 など、注目記事を音声化

注目集める「AIエージェント」、一問一答型から自律的なシステムに

新モデル「Claude Mythos」の衝撃 数千の脆弱性を発見、一般公開せず

「対応せざるを得ない」、Anthropicの「Mythos」に身構える日本の金融業界

関連おすすめサービス

Notta搭載AI議事録イヤホン ZENCHORD1

AI搭載ボイスレコーダー Plaud

画像高画質化AIツール Aiarty Image Enhancer

日立やNEC、フィジカルAIで脱「人月商売」／AIエージェント時代に台頭する「FDE」など、注目記事を音声化

新モデル「Claude Mythos」の衝撃数千の脆弱性を発見、一般公開せず