DPrivBench:差分プライバシーにおけるLLMの推論能力のベンチマーク
arXiv cs.LG / 2026/4/20
📰 ニュースSignals & Early TrendsIdeas & Deep AnalysisModels & Research
要点
- 本論文は、非専門家でも扱えるように、差分プライバシー(DP)アルゴリズムの設計・検証に必要な困難な推論をLLM(大規模言語モデル)で自動化できるかを検討している。
- そのために、DPrivBenchという新しいベンチマークを提示し、各タスクでは「与えられた仮定の下で、ある関数やアルゴリズムが指定されたDP保証を満たすか」を問う。
- ベンチマークは、単純なパターン照合による近道的な推論を防ぐように設計され、DPの本質的な推論を評価することを狙っている。
- 実験では、最も強力なモデルは教科書的なDPメカニズムに対してはよく機能する一方で、先進的なDPアルゴリズムでは大きくつまずき、現在の自動DP推論能力のギャップが明確になった。
- 著者らは分析および失敗モードの調査を行い、改善の有望な方向性を示し、DPrivBenchを今後の手法開発と評価の土台として位置づけている。


