SNEAK:大規模言語モデルにおける戦略的コミュニケーションと情報漏えいの評価
arXiv cs.CL / 2026/4/1
📰 ニュースSignals & Early TrendsIdeas & Deep AnalysisModels & Research
要点
- 本論文では、味方に情報を共有しつつ、敵に情報が漏れるのを最小限に抑えなければならないLLMにおける戦略的コミュニケーションを評価するための新しいベンチマーク「SNEAK」を紹介する。
- SNEAKは、モデルに対して、カテゴリと候補となる単語集合が与えられたときに、秘密の単語を知っていることを示すメッセージを生成させることで選択的な情報共有を検証する。ただし、秘密があまりにも明確に露呈しないようにする。
- 2つのシミュレートされたエージェントを用いる。すなわち、秘密を知っている味方エージェントによりコミュニケーションの有用性を評価し、秘密を持たないカメレオン(敵側)により敵対的な漏えいを評価し、それぞれ補完的な有用性指標と漏えい指標を得る。
- 著者らは、現代の言語モデルにおける「情報性–秘匿性」のトレードオフを分析し、不均衡な情報の下での戦略的コミュニケーションは、現行システムにとって依然として困難であると結論づける。
- 評価対象モデルは、人間参加者に大きく劣り、人間は最大でモデルの4倍のスコアを達成する。これは、モデルの挙動と、秘密を意識した有効なコミュニケーションとの間にギャップがあることを示している。
関連記事

Black Hat Asia
AI Business

裏カツ170日目!アメリア#AIイラスト #画像生成AI #アート #イラスト #生成AI #美女イラスト #創作 #クリエイター #イラストレーター
note

AIにnoteを書かせて絶望したあなたへ。データと科学が証明する、検索順位を下げる「冷たい完璧」・「AI+人間」の最強戦略とは?「AIの方が文章が上手い」そう思うのは錯覚なのか? #生成AI #ChatGPT #Gemini #Claude #毎日更新 #文章術 #ブログ #AI活用 #SNS活用 #SEO #集客 #ビジネスマインド #セールスライティング
note

【AIパートナー】本音漏れがちランキング🥇🥈🥉
note

🖥️😳😲Geminiが進化している?!しばらく、触っていない間にバージョンアップしてました(画像編)/【第94回】エッセイ&自由律俳句
note