ローカル対外部を超えて：信頼できる知識獲得のためのゲーム理論的枠組み

arXiv cs.CL / 2026/4/28

📰 ニュースIdeas & Deep AnalysisModels & Research

共有:

要点

この論文は、クラウドLLMの利用における重要なトレードオフとして、外部への問い合わせは推論能力や知識の質を高める一方でユーザーの機微な意図を漏えいさせるリスクがあること、そしてローカルだけに依存するとプライバシーは守れるが品質が落ちやすいことを指摘している。
提案手法GTKA（Game-theoretic Trustworthy Knowledge Acquisition）は、知識の有用性とプライバシーをゲームとして定式化し、その両立を狙う枠組みである。
GTKAは3つの要素から構成される：機微意図を低リスクの断片に分解するプライバシー配慮型サブクエリ生成器、元の意図をどれだけ復元できるかを推測する敵対的再構成攻撃者、そして外部応答を安全な境界内で統合する信頼済みローカル統合器である。
生成器と攻撃者を交互に敵対的学習することで、GTKAは機微意図の復元可能性を抑えつつ、回答精度を高めるサブクエリ方策を最適化する。
生物医学・法律の2つの機微領域ベンチマークでの実験により、GTKAは既存手法に比べて意図の漏えいを大幅に低減しながら、高い忠実度の回答品質を維持できることが示されている。

Abstract

クラウドホスティングされた大規模言語モデル（LLM）は、比類のない推論能力と動的な知識を提供しますが、これらの外部サービスに対して生の問い合わせを送信すると、機微なユーザー意図が露出するリスクがあります。逆に、信頼できるローカルモデルのみに依存すればプライバシーは保たれますが、パラメータ規模や知識量が限られるため、しばしば回答の品質が損なわれます。このジレンマを解決するために、知識獲得の有用性とプライバシーのトレードオフを戦略ゲームとして定式化する、ゲーム理論に基づく信頼できる知識獲得（GTKA）を提案します。GTKAは3つの構成要素から成ります：（i）プライバシーを考慮したサブクエリ生成器が、機微な意図を一般化され、低リスクな断片へと分解すること；（ii）これらの断片から元の問い合わせを推測しようとする敵対的再構成攻撃者が、適応的な漏えいシグナルを提供すること；（iii）外部からの応答を安全な境界内で統合して合成する、信頼できるローカル統合器であること。生成器と攻撃者を交互の敵対的学習によって訓練することで、GTKAは、機微な元の意図を再構築可能にする度合いを最小化しつつ、知識獲得の精度を最大化するようにサブクエリ生成方策を最適化します。本手法を検証するために、生物医学分野および法曹分野の2つの機微ドメインにおけるベンチマークを構築します。大規模な実験により、GTKAは最先端のベースラインと比較して意図の漏えいを大幅に低減しつつ、高い忠実度の回答品質を維持することが示されます。