概要: 機械アンラーニングは、学習済みモデルからデータ点を忘れ去ることを目指し、完全な再学習を行わずにデータ削除要求を処理し、プライバシー上のリスクを軽減するための原理に基づいた方法を提供します。従来の研究は主に教師なし/教師ありの機械アンラーニングを扱っており、逐次的な意思決定システムにおけるアンラーニングは、十分に理解されていません。私たちは、基礎となる逐次的意思決定の問題に対する最初の研究に着手します。それは、オフライン確率的多腕バンディット(MAB)です。オフラインMABに対するプライバシー制約を形式化し、ユーティリティを、アンラーニング後の意思決定の質によって測定します。固定サンプルモデルと分布モデルという2つのデータ生成モデルのもとで、単一ソースおよび複数ソースの双方のアンラーニング状況について体系的な研究を行います。これらの設定において、私たちのアルゴリズム設計は2つの代表的な基礎アルゴリズム、すなわちガウス機構とロールバックに基づいており、データのレジームとプライバシー制約に応じてそれらを切り替える適応的アルゴリズムを提案します。さらに、これらの基礎手法の背後にある合理性を明らかにする混合手続きを導入します。上記の設定すべてにわたって性能保証を提示し、両方のデータセットモデルのもとで下界を確立します。実験により、予測されるトレードオフが検証され、提案手法の有効性が示されます。
オフライン・確率的マルチアームドバンディットにおけるアンラーニング
arXiv cs.LG / 2026/5/4
📰 ニュースIdeas & Deep AnalysisModels & Research
要点
- この論文は、データ削除要求とプライバシーリスクに対して、完全な再学習をせずに対応するための機械アンラーニングを、オフラインの確率的マルチアームドバンディット(MAB)に対して研究しています。
- オフラインMABにおけるプライバシー制約を定式化し、「アンラーニング後」の意思決定の質を用いて有用性(ユーティリティ)を評価します。
- 著者らは、固定サンプル・モデルと分布モデルという2つのデータ生成レジームの下で、単一ソースおよび複数ソースのアンラーニングを体系的に分析し、各設定に適したアルゴリズム設計を示します。
- 提案手法はガウス機構とロールバックという2つの基盤要素に基づき、データ状況とプライバシー制約に応じて切り替える適応的アルゴリズムや、基盤手法の妥当性を説明する混合手順を含みます。
- 理論的保証(下限を含む)に加えて実験も行い、プライバシーと有用性のトレードオフが予測通りであることを検証しています。
