CIPHER：表現を通じた偽造画像パターンの高レベル解析

arXiv cs.CV / 2026/4/1

💬 オピニオンSignals & Early TrendsIdeas & Deep AnalysisModels & Research

共有:

要点

CIPHERは、GANや拡散システムのように急速に進化する複数の生成モデルにわたって頑健性を維持することを目的とした、提案型のディープフェイク検出フレームワークである。
この手法は、既存の画像生成モデルから判別器（discriminator）を再利用して微調整し、スケール適応および時間的整合性の特徴を用いることで、生成に依存しないアーティファクトを抽出する。
9つの最先端の生成モデルに対する実験により、モデルをまたいだ性能が高いことが示され、最大74.33%のF1スコアを達成し、ViTベースの検出器に対して平均で30%以上向上した。
CIPHERは、ベースライン検出器が失敗するような難しいベンチマークデータセットでも有効であると報告されており、従来手法がほぼゼロであるのに対して、CIFAKEでは最大88%のF1スコアを達成する。
著者らは、判別器の再利用とモデルをまたいだ微調整によって、生成品質が向上していく中でもより汎用的で将来に備えたディープフェイク検出の方向性が得られると主張している。

要旨: 生成的敵対ネットワーク（GAN）と拡散モデルの急速な進歩により、実画像との見分けがますます困難な合成顔画像の作成が可能になりました。しかし、この進歩はまた、誤情報、詐欺、アイデンティティ悪用といったリスクを増幅させており、多様な生成モデルに対して頑健であり続ける検出器が緊急に必要であることを強く示しています。本研究では、表現によるカウンターフェイト画像パターン高レベル検査（Counterfeit Image Pattern High-level Examination via Representation(CIPHER)）を導入します。これは、画像生成のために元々学習された識別器（ディスクリミネータ）を体系的に再利用し、微調整することで構築されたディープフェイク検出フレームワークです。ProGAN識別器からスケールに適応した特徴を抽出し、拡散モデルから時間的整合性の特徴を抽出することで、CIPHERは従来の検出器が見落としがちな、生成に依存しない（generation-agnostic）アーティファクトを捉えます。9つの最先端の生成モデルにまたがる大規模な実験を通じて、CIPHERはモデル間での検出性能が優れていることを示し、最大74.33%のF1スコアを達成します。また、平均F1スコアにおいて、既存のViTベースの検出器を30%以上上回ります。特に、本手法はベースライン手法が失敗する難しいデータセットにおいても頑健な性能を維持し、CIFAKEでは従来の検出器がほぼゼロ性能であるのに対して最大88%のF1スコアを実現します。これらの結果は、識別器の再利用とモデル間微調整の有効性を裏付けており、急速に進化する生成技術の時代において、より一般化可能で頑健なディープフェイク検出システムを構築するための有望なアプローチとしてCIPHERを位置づけるものです。