概要: LLMにおけるプライバシー上の懸念により、データの「忘れられる権利(right to be forgotten)」を強制する必要性が急速に高まっています。機械アンラーニングは、まさにこの課題、すなわち、訓練済みモデルから特定のデータ(忘却集合、forget set)による影響を除去することを扱います。アンラーニングのゴールドスタンダードは、残りの訓練データ(保持集合、retain set)だけで学習されたはずのモデルを生成することです。既存のほとんどのアンラーニング手法は保持データへの直接アクセスに依存していますが、プライバシーやコストの制約により、それが現実的でない場合があります。本研究では、WIN-Uという、保持データを必要としないアンラーニングの枠組みを提案します。WIN-Uは、全データで元々訓練されたモデルについて、必要なのは2次情報のみです。アンラーニングは、単一のニュートン法風ステップを用いて実行します。Woodburyの行列恒等式と、忘却集合における曲率に対する一般化ガウス=ニュートン近似により、WIN-Uの更新は閉形式の線形解を復元し、ゴールドスタンダードの再学習最適解に対する局所的な2次近似として機能します。さまざまな視覚・言語ベンチマークに対する大規模な実験により、WIN-Uが、アンラーニングの有効性と有用性の保持という観点でSOTAの性能を達成し、既存手法と比べて再学習攻撃に対してより頑健であることが示されます。重要なのは、WIN-Uが保持データへのアクセスを必要としないことです。
WIN-U: Woodburyに着想を得たNewton型アンラーニングとしての、保持データ不要の機械アンラーニングフレームワーク
arXiv cs.LG / 2026/4/16
📰 ニュースSignals & Early TrendsIdeas & Deep AnalysisModels & Research
要点
- WIN-Uは、学習済みモデルにおける「忘れられる権利(right to be forgotten)」を強制するための、保持(retain)データ不要の機械アンラーニングフレームワークとして提案されており、保持学習データを必要とせずに、指定された忘却セットが与える影響を除去します。
- この手法は、元の学習モデルから得られる二次情報のみを用い、Woodbury行列恒等式と、忘却セットの曲率を扱うための一般化ガウス=ニュートン近似により、1回のニュートン型アップデートを適用します。
- WIN-Uは、局所的な二次展開によって(保持セットのみで学習した)ゴールドスタンダードの再学習最適解を近似するよう設計されており、多くの既存のアンラーニング手法が要求するデータアクセス要件を回避します。
- 複数の視覚と言語のベンチマークにわたる実験では、最先端のアンラーニング有効性と強いユーティリティの保持が報告されており、さらに従来手法よりも再学習攻撃に対する頑健性が向上しています。
