要旨: 概念の忘却は、テキストから画像への拡散モデルにおける有害なコンテンツ生成のリスクを低減する有望な方向性として浮上しており、モデルのパラメータから望ましくない概念を選択的に消去することによって実現します。既存のアプローチは通常、学習解除対象の概念を特定するためにキーワードに依存します。しかし、このキーワードベースの定式化には固有の限界があることを示します:視覚的概念は多次元的で、多様なテキスト形式で表現でき、潜在空間における関連概念としばしば重なることもあるため、キーワードのみのアンラーニングはターゲット概念を不正確に示すため脆く、過剰忘却を起こしやすいです。これは、単一のキーワードが概念の狭い点推定に過ぎず、全体的な意味分布と潜在空間における絡み合った変動をカバーし切れないために起こります。この制限に対処するため、Diversified Unlearning(多様化忘却)を提案します。これは、単一のキーワードよりも、文脈的に多様なプロンプトの集合を用いて概念を表現する分布的フレームワークです。この豊かな表現により、より正確で堅牢な忘却が可能になります。複数のベンチマークと最先端のベースラインを横断した広範な実験を通じて、既存の忘却パイプラインに追加コンポーネントとして Diversified Unlearning を組み込むことが、一貫してより強力な削除、関連しない概念の保持の向上、および敵対的回復攻撃に対する堅牢性の改善をもたらすことを示しています。
概念は単なる言葉以上のもの:テキストから画像への拡散モデルにおける多様化された忘却
arXiv cs.AI / 2026/3/20
📰 ニュースModels & Research
要点
- 本論文は Diversified Unlearning(多様化された忘却)を提案し、テキストから画像への拡散モデルから消去する単一のキーワードではなく、文脈的に多様な複数のプロンプトで概念を表現する分布的アプローチである。
- 概念の多次元的性質と潜在空間の絡み合いのため、キーワードベースの忘却には限界があることを強調しており、それは不完全な忘却と過剰忘却につながる可能性がある。
- 本手法は既存の忘却パイプラインへの追加コンポーネントとして適用でき、より強力な忘却、関連のない概念の保持の改善、および敵対的回復攻撃に対する頑健性を実現する。
- ベンチマークと最先端のベースラインにわたる実験結果は、忘却と頑健性の向上を示しており、モデル展開における実用的な安全性の利点を示唆している。
関連記事
次世代LLM推論技術: Flash-MoE から Gemini Flash-Lite、そしてローカルGPU活用へ
Dev.to
オープンソースAIの波とセキュリティへの投資: Qwen、Microsoft、Google の動向
Dev.to

AIモデルがクリエイティブな文章を書けないのは初期モデルに見られた創造性や独創性を抑制してビジネス用途に特化させたせいだという指摘
GIGAZINE
RLax、JAX、Haiku、Optax を用いてスクラッチから Deep Q-Learning(DQN)を実装し、カートポール環境の強化学習エージェントを訓練する
MarkTechPost
[D]SQLのみで分類器を訓練する(反復的最適化なし)
Reddit r/MachineLearning