レンジ符号化による効率的で証明可能に安全な言語学的ステガノグラフィ

arXiv cs.CL / 2026/4/10

💬 オピニオンSignals & Early TrendsIdeas & Deep AnalysisModels & Research

共有:

要点

本論文は、言語モデルが生成したテキストに対する、セキュリティを維持しつつ、従来のKLダイバージェンス完全（KL-divergence–perfect）手法よりも埋め込み容量と効率を向上させることを目的とした、証明可能に安全な言語学的ステガノグラフィを扱う。
中核となるメカニズムとしてレンジ符号化を用い、さらに追加の回転（rotation）メカニズムを導入することで、効率的で証明可能に安全なステガノグラフィ方式を実現する。
複数の言語モデルにわたる実験により、概ね100%のエントロピー活用（高い埋め込み効率）が示され、基準となる証明可能に安全なアプローチよりも良好な性能が報告されている。
埋め込み速度はGPT-2で最大1554.66 bits/sに達し、本手法が理論的に裏付けられているだけでなく実用的であることが示される。
著者らは、再現やさらなる実験を可能にするためのコードをGitHubで公開している。

Abstract

言語ステガノグラフィは、一見無害な文章の中に秘密のメッセージを埋め込み、秘匿通信を可能にすることを含む。長年の目標であり主要な動機でもある、証明可能な安全性は、言語モデルに基づくステガノグラフィへと拡張されてきた。これまでの証明可能に安全な手法は、ゼロのKullback-Leibler（KL）ダイバージェンスによって測られる完全な不可視性を達成してきたが、その代償として埋め込み容量が犠牲になっていた。本論文では、古典的なエントロピー符号化手法（レンジ符号化）を直接用いて安全なステガノグラフィを達成し、さらに回転メカニズムを備えた、効率的かつ証明可能に安全な言語ステガノグラフィ手法を提案する。様々な言語モデルに対する実験の結果、提案手法は埋め込み容量において、既存のベースライン手法を上回りながら、エントロピー利用率（埋め込み効率）がおよそ100%であることが示された。さらに、埋め込み速度も高く（GPT-2上で最大1554.66 bits/s）、達成している。コードは github.com/ryehr/RRC_steganography で利用可能である。