差分プライバシーに基づく最良アーム識別

arXiv stat.ML / 2026/4/9

💬 オピニオンIdeas & Deep AnalysisModels & Research

要点

  • 本論文は、差分プライバシー下での最良アーム識別(BAI)を扱い、確信度(confidence)を固定したもとで、ローカルモデル(1-local DP)と中央モデル(1-global DP)の両方を対象とする。
  • 1-global または 1-local 差分プライバシーを満たす、0-correct BAI アルゴリズムの任意のサンプル計算量(sample complexity)について下界を導出し、「高プライバシー」と「低プライバシー」という異なるレジームを特定する。
  • 高プライバシー・レジームでは、難しさはプライバシーと、総変動距離(total variation distance)に結び付いた情報理論的な量の、結合した効果に依存する。一方、低プライバシー・レジームでは、下界が非プライベート時の難しさと一致する。
  • 著者らは、Top Two アルゴリズムの 1-local および 1-global の新しい差分プライバシー版(CTB-TT と AdaP-TT*)を提案する。CTB-TT は、Randomised Response に基づくプライベートな平均推定器を用いる。
  • 1-global DP については、ラプラスノイズ(Laplace noise)を加える、アーム依存の適応的エピソード型平均推定器を用いる。さらに、交通コスト(transportation costs)を適応させることで、AdaP-TT* が定数倍の範囲で漸近的な下界を達成できることを証明する。

Abstract

ベストアーム同定(BAI)問題は、適応的臨床試験の設計、ハイパーパラメータの調整、ユーザ研究の実施といったデータに敏感なアプリケーションで、次第に用いられるようになっている。これらのアプリケーションによって生じるデータプライバシー上の懸念に動機づけられ、局所モデルと中央モデルの両方において固定の信頼度のもとでのBAI問題、すなわち
-localおよび
-globalの差分プライバシー(DP)を研究する。まず、プライバシーのコストを定量化するために、
-global DPまたは
-local DPを満たす任意の
-correct BAIアルゴリズムのサンプル複雑性について下界を導出する。我々の下界は、2つのプライバシー・レジーム(領域)の存在を示唆している。高プライバシー・レジームでは、困難さは、プライバシーと、全変動(Total Variation)に関わる新しい情報理論的量の結合効果に依存する。低プライバシー・レジームでは、下界は非プライベートの下界に還元される。Top Twoアルゴリズムの
-local DPおよび
-global DPの変種として、それぞれCTB-TTとAdaP-TT*を提案する。
-local DPにおいて、CTB-TTは、Randomised Responseに基づく手段のためのプライベート推定量を差し込むことで漸近的に最適となる。$$-global DPにおいて、平均の我々のプライベート推定量は、アーム依存の適応的エピソードで動作し、良好なプライバシー-効用のトレードオフを保証するためにラプラスノイズを加える。輸送コスト(transportation costs)を適応させることで、AdaP-TT*の期待サンプル複雑性は、乗法定数の範囲で漸近的下界に到達する。