AI Navigate

Safety-Guided Flow(SGF):安全な生成におけるネガティブガイダンスの統一フレームワーク

arXiv cs.CV / 2026/3/17

💬 オピニオンIdeas & Deep AnalysisModels & Research

要点

  • 本論文は Safety-Guided Flow(SGF)を提案する。最大平均不一致(MMD)ポテンシャルを用いて、Shielded Diffusion と Safe Denoiser の双方を、不安全なデータサンプルに対するエネルギーに基づくネガティブガイダンスの実例として位置づける統一的な確率的フレームワーク。
  • 本フレームワークは、コントロールバリア関数の解析を活用して、デノイジング過程におけるネガティブガイダンスが強くなるべき臨界的な時間窓を正当化し、この窓の外ではガイダンスをゼロへと減衰させることで、安全で高品質な生成を保証する。
  • 本フレームワークは、いくつかの現実的な安全生成シナリオで評価され、デノイジング過程の早期にネガティブガイダンスを適用することが、安全な生成を成功させるために不可欠であることを確認した。
  • ロボティクス風の安全制約とデータ駆動型ネガティブガイダンスを統合することにより、本研究は生成時に安全ガイダンスが実際に必要となる時期についての理論的根拠を提供する。

要約:拡散モデルとフロー模型の安全機構は、最近、二つの異なる道筋に沿って開発されてきました。ロボット計画では、生成軌道を障害物から遠ざけるよう、各デノイジングステップで幾何的制約を明示的に課すことで、制御バリア関数が用いられます。並行して、最近のデータ駆動型のネガティブガイダンス手法は、有害な内容を抑制し、生成サンプルの多様性を促進することが示されています。しかし、それらはヒューリスティクスに依存しており、安全ガイダンスが実際に必要な時期を明確には示していません。本論文では、画像生成タスクのための最大平均差異(Maximum Mean Discrepancy、MMD)ポテンシャルを用いた統一的確率フレームワークを初めに導入し、Shielded DiffusionとSafe Denoiserの双方を、未安全データサンプルに対する私たちのエネルギーベースのネガティブガイダンスのインスタンスとして再解釈します。さらに、制御バリア関数の解析を活用して、ネガティブガイダンスが強くなるべき臨界的な時間窓の存在を正当化します。この窓の外では、安全で高品質な生成を保証するためにガイダンスはゼロへ減衰すべきです。私たちは、いくつかの現実的な安全生成シナリオで統一フレームワークを評価し、ネガティブガイダンスはデノイジングプロセスの初期段階で適用されるべきであることを、成功した安全生成を確保することを確認しました。