総変動距離に基づく相関を微分プライバシーに統合し、DP-ERMへの応用

arXiv stat.ML / 2026/5/6

💬 オピニオンModels & Research

要点

  • この論文は、標準的な微分プライバシーがすべての特徴に一律の保護を課すという制約に対し、現実のデータでは機微な特徴と機微でない特徴が混在する点に着目します。
  • 総変動距離を用いて機微な特徴との相関を考慮しつつ、「機微でない」特徴をより緩く扱えるようにする、緩和型のプライバシー定義CorrDPを提案します。
  • 著者らはCorrDPに対応した、微分プライバシー付き経験的リスク最小化(DP-ERM)のアルゴリズムを設計し、理論上の有用性(ユーティリティ)を高めるために勾配へ距離依存のノイズを加えます。
  • 特徴間の相関距離が未知の場合はデータから推定しても、プライバシーとユーティリティの両面で同等の保証が得られることを示します。
  • 合成データと実データの実験により、機微でない特徴が存在する場合にCorrDPベースのDP-ERMが標準的なDP手法より一貫して優れることを報告しています。

Abstract

標準的な差分プライバシーは、すべての特徴に対して一様なプライバシー制約を課すため、実際における機微な特徴とそうでない特徴の本質的な違いを見落としている。本論文では、このような異質性を考慮する差分プライバシーの緩和された定義を導入し、機微な特徴と相関していても、特定の特徴を機微でないものとして扱えるようにする。相関を考慮したフレームワーク、\textsf{CorrDP} を提案する。\textsf{CorrDP} は、機微でない特徴についてプライバシーを緩和しつつ、それらの機微な特徴との相関を、全変動距離によって定量化しながら考慮する。さらに、\textsf{CorrDP} の枠組みに基づく差分プライバシー付き経験的リスク最小化(DP-ERM)のためのアルゴリズムを設計し、理論的な効用保証を改善するために、勾配に距離依存のノイズを組み込む。相関距離が未知の場合には、データセットからそれを推定し、同等のプライバシー・効用保証を達成することを示す。合成データセットおよび実世界データセットで実験を行い、機微でない特徴が存在する場合において、\textsf{CorrDP} に基づく DP-ERM アルゴリズムが標準的な DP フレームワークを一貫して上回ることを示す。