ディープフェイク検出のためのCurveletベースの周波数対応特徴強調

arXiv cs.AI / 2026/4/15

💬 オピニオンSignals & Early TrendsIdeas & Deep AnalysisModels & Research

要点

  • 本論文は、Curvelet変換を活用して、方向性と多尺度性に優れた周波数領域の特徴を抽出するディープフェイク検出器を提案し、空間領域の手がかりに依存する検出器で見られる頑健性の課題に対処します。
  • wedge(くさび)レベルの注意(attention)と、スケールに応じた空間マスキングを導入して、識別的な周波数成分を選択的に強調し、その後、分類のための洗練された周波数手がかりを再構成します。
  • 再構成された特徴は、修正した事前学習済みのXceptionネットワークに投入され、周波数強調と確立されたCNN分類を組み合わせます。
  • FaceForensics++で2種類の圧縮品質を用いて評価した結果、低圧縮では精度98.48%、AUC 99.96%を報告し、高圧縮においても強い性能を維持しています。
  • 著者らは、Curveletを手がかりとする改ざん検出パイプラインの有効性と解釈可能性の両方を強調し、これをディープフェイクの頑健性に向けた新しい周波数表現として位置づけています。

Abstract

洗練された生成モデルの普及により、ディープフェイクとして知られる合成顔コンテンツのリアリティは大幅に向上し、デジタル・トラストに対する深刻な懸念が高まっている。現代の深層学習ベースの検出器は良好な性能を発揮するものの、多くは圧縮下で劣化する空間領域の特徴に依存している。この制約により、堅牢性を高めるために、周波数領域の表現を深層学習と統合する方向への転換が促されている。これまでの研究では、離散コサイン変換(Discrete Cosine Transform: DCT)、高速フーリエ変換(Fast Fourier Transform: FFT)、ウェーブレット変換など、さまざまな周波数変換が検討されてきた。しかし、我々の知る限りでは、優れた方向性およびマルチスケール特性を持つCurvelet変換は、ディープフェイク検出の文脈ではまったく探索されていない。本研究では、ウェッジ(くさび)レベルの注意(attention)と、スケールに応じた空間マスキングの両方を用いて特徴品質を高める、新しいCurveletベースの検出アプローチを提案する。これらは識別的な周波数成分を選択的に強調するように学習される。精緻化された周波数手がかりを再構成し、改変した事前学習済みXceptionネットワークに渡して分類を行う。難しいFaceForensics++データセットにおける2種類の圧縮品質で評価したところ、本手法はFF++低圧縮で98.48%の精度と99.96%のAUCを達成し、高圧縮下でも強い性能を維持した。これにより、Curveletに基づく改ざん検出の有効性と解釈可能性が示された。