SALMUBench:センシティブな関連(アソシエーション)レベルのマルチモーダル・アンラーニングのためのベンチマーク
arXiv cs.CV / 2026/3/30
📰 ニュースSignals & Early TrendsIdeas & Deep AnalysisModels & Research
要点
- 本論文は、コントラスト学習されたマルチモーダルエンコーダに対するセンシティブな関連(アソシエーション)レベルの「アンラーニング」を評価するための新しいベンチマーク SALMUBench を提案する。
- 60K件のペルソナ―属性の関連からなる合成データセットを用い、そのデータによって汚染された「Compromised(妥協済み)」モデルと、同じ保持(retain)ベースを用いて同一条件でスクラッチから再学習した「Clean(クリーン)」モデルを比較することで、アンラーニング効果を切り分けている。
- 著者らは、削除の有効性と副作用(コラテラルダメージ)の両方を測るために、特定のホールドアウトセット(例:ホールドアウト同一性、ホールドアウト関連)を用いた構造化された評価プロトコルを提案する。
- 結果は、ユーティリティを効率的に保った削除は達成可能であることを示唆する一方で、既存のアンラーニング手法には明確な失敗モードがあることを示している。すなわち、十分に忘れられない(under-forgetting)場合や、過度に一般化してしまい、消しすぎる(過消去)場合である。
- SALMUBench は、データセット、モデル、評価スクリプト、リーダーボードとともに公開されており、包括的なアンラーニング評価に向けたさらなる研究を支援する。



