要旨: テキストから画像を生成する生成モデルは、高い忠実度と多様性を達成していますが、大規模な学習データセットに埋め込まれた暗黙のバイアスによって、意図しない安全でない、または望ましくないコンテンツを生成してしまうことがあります。既存の概念消去(concept erasure)手法は、テキストのみ、または画像を補助的に用いるもののいずれであってもトレードオフがあります。テキストベースの手法は概念を十分に抑制できないことが多く、素朴な画像誘導の手法は無関係なコンテンツを過剰に消去してしまうリスクがあります。私たちは、連続的な凸な概念マニフォールドと階層的な視覚表現学習によって、正確かつ忠実な概念の除去を実現するテキスト・画像協調的消去フレームワークTICoEを提案します。TICoEは、無関係な意味的・視覚的コンテンツを保持しつつ、標的となる概念を正確に除去します。消去の品質を客観的に評価するために、消去後の利用可能性を測定する忠実度志向の評価戦略も新たに導入します。複数のベンチマークにおける実験により、TICoEは概念除去の精度とコンテンツの忠実度の両面で従来手法を上回り、より安全で、より制御可能なテキストから画像の生成を可能にします。コードは https://github.com/OpenAscent-L/TICoE.git で公開しています
テキストプロンプトの先へ:テキストと画像の協調による精密なコンセプト消去
arXiv cs.CV / 2026/4/20
📰 ニュースIdeas & Deep AnalysisTools & Practical UsageModels & Research
要点
- この論文は、テキストから画像を生成するモデルにおける安全性の重要課題(大規模学習データに埋め込まれたバイアスにより、不適切な内容が生成されうること)を扱っています。
- 既存のコンセプト消去手法を、テキストのみでは概念を十分に抑えきれない一方で、素朴な画像誘導は関係のない内容まで消しすぎるリスクがあるという観点から整理しています。
- 著者らはTICoE(Text-Image Collaborative Erasing)を提案し、連続的な凸のコンセプト・マニフォールドと階層的な視覚表現学習により、対象コンセプトを精密に除去しつつ他の意味・視覚内容を保持することを目指します。
- 消去後の出力の有用性を測る「忠実度(fidelity)志向」の評価戦略を新たに導入し、除去成功だけでなく使いやすさも客観的に評価します。
- 複数ベンチマークでの実験により、TICoEは先行手法よりもコンセプト除去の精度と内容の忠実度の両面で優れており、コードも公開されています。



