DPrivBench:差分プライバシーにおけるLLMの推論能力のベンチマーク

arXiv cs.LG / 2026/4/20

📰 ニュースSignals & Early TrendsIdeas & Deep AnalysisModels & Research

要点

  • 本論文は、非専門家でも扱えるように、差分プライバシー(DP)アルゴリズムの設計・検証に必要な困難な推論をLLM(大規模言語モデル)で自動化できるかを検討している。
  • そのために、DPrivBenchという新しいベンチマークを提示し、各タスクでは「与えられた仮定の下で、ある関数やアルゴリズムが指定されたDP保証を満たすか」を問う。
  • ベンチマークは、単純なパターン照合による近道的な推論を防ぐように設計され、DPの本質的な推論を評価することを狙っている。
  • 実験では、最も強力なモデルは教科書的なDPメカニズムに対してはよく機能する一方で、先進的なDPアルゴリズムでは大きくつまずき、現在の自動DP推論能力のギャップが明確になった。
  • 著者らは分析および失敗モードの調査を行い、改善の有望な方向性を示し、DPrivBenchを今後の手法開発と評価の土台として位置づけている。

Abstract

差分プライバシー(DP)はデータのプライバシー保護に幅広い用途を持っていますが、DPアルゴリズムの設計と検証には専門家レベルの推論が必要であり、非専門の実務者にとっては高い障壁となっています。先行研究では、あるいは多大なドメイン知識を要求する専用の検証言語に依存するか、あるいは半自動であり人間がループに入ってガイダンスを行うことが必要でした。本研究では、大規模言語モデル(LLM)がDPの推論を自動化できるかどうかを調査します。各インスタンスが、指定された仮定のもとで、ある関数またはアルゴリズムが定められたDP保証を満たすかどうかを問うベンチマークであるDPrivBenchを提案します。このベンチマークは、DPの幅広いトピックをカバーするよう注意深く設計され、難易度の多様な水準をまたぎ、単純なパターンマッチングによる近道的な推論に耐えるようにしています。実験の結果、最も強力なモデルは教科書的なメカニズムをうまく扱える一方で、すべてのモデルが高度なアルゴリズムでは苦戦しており、現在のDP推論能力には大きなギャップがあることが明らかになりました。さらに分析的な研究と失敗モード分析を通じて、自動化されたDP推論を改善するための有望な方向性をいくつか特定します。本ベンチマークは、そのような手法を開発し評価するための確固たる基盤を提供するとともに、既存の数学的推論のためのベンチマークを補完します。