要旨: マルチビット・ウォーターマーキングは、大規模言語モデル(LLM)が生成したテキストに、不可視な二値メッセージを埋め込むための有望な解決策として登場し、悪意のあるLLM利用の信頼できる帰属付けおよび追跡を可能にします。近年の進展にもかかわらず、既存手法には依然として重要な制約があります。すなわち、ある手法は大きなメッセージに対して計算的に実行不可能になり、また別の手法はテキスト品質と復号精度の間のトレードオフが不十分です。さらに、生成テキスト中のトークン数が制限されると、既存手法の復号精度が大幅に低下しますが、この条件は実運用で頻繁に生じます。これらの課題に対処するため、
extsc{XMark} は、LLM生成テキストにおける二値メッセージの符号化および復号のための新しい手法を提案します。
extsc{XMark} のエンコーダの独自設計により、ウォーターマーク付きトークン生成における歪みの少ないロジット分布が生成され、テキスト品質を維持できるだけでなく、限られたトークン数でも符号化メッセージを確実に復元できるように調整された復号器も実現します。多様な下流タスクにまたがる広範な実験により、
extsc{XMark} は、水印付きテキストの品質を維持しながら、復号精度を大きく向上させ、従来手法よりも優れていることが示されます。コードは https://github.com/JiiahaoXU/XMark にあります。
XMark:LLM生成テキスト向けの信頼性の高いマルチビット透かし
arXiv cs.CL / 2026/4/8
💬 オピニオンIdeas & Deep AnalysisTools & Practical UsageModels & Research
要点
- XMarkは、悪意のあるLLM利用を確実に帰属・追跡するための、目立たないバイナリメッセージを埋め込むことを目的とした、LLM生成テキスト向けの提案マルチビット透かし手法である。
- 本研究は、先行手法の以下のような欠点に取り組む。すなわち、大きなメッセージに対して計算が非現実的である点、品質と復号のトレードオフが弱い点、そして利用可能なトークン数が限られると復号精度が急激に劣化する点である。
- XMarkのエンコーダは、テキスト品質を保つために歪みの少ないロジット分布を生成するよう設計されている。さらに、トークン制限下でもメッセージを確実に復元するための専用デコーダが構築されている。
- 複数の下流タスクにまたがる実験では、XMarkが透かしテキストの品質を維持しつつ、復号精度を大幅に改善し、先行手法よりも優れていると報告されている。
- 著者らは、リンクされたGitHubリポジトリで実装を提供しており、再現やさらなる評価を可能にしている。




