Dynamic Assembly Forestsによる拡散生成画像の検出

arXiv cs.CV / 2026/4/13

💬 オピニオンIdeas & Deep AnalysisModels & Research

要点

  • 拡散モデルが生成する画像の悪用リスクに対し、従来のCNN/Transformer等のDNN中心の検出アプローチとは別に、伝統的なMLでの検出可能性を検討しています。
  • 深層フォレスト(deep forest)を土台にしたDynamic Assembly Forest(DAF)を提案し、特徴学習や大規模学習に関わるDNNの制約を補うことで、拡散生成画像検出を実現します。
  • DAFはDNNベース手法と比べてパラメータ数が少なく、計算コストも低く、GPUなしでのデプロイが可能である点が強調されています。
  • 標準的な評価プロトコルで競争力のある性能を示したとされ、リソース制約のある環境での「重いDNNの実用的代替」になり得ると結論づけています。
  • コードとモデルがGitHubで公開されています(https://github.com/OUC-VAS/DAF)。

概要: 拡散モデルは高品質な画像を生成できることで知られており、深刻なセキュリティ上の懸念を引き起こしています。これに対抗するため、これまでの取り組みのほとんどは深層ニューラルネットワーク(例:CNNやTransformer)に依存している一方で、伝統的な機械学習モデルの可能性はほとんど見過ごされてきました。本論文では、このような代替案をあらためて新規に調査し、拡散によって生成された画像を検出するための新しいDynamic Assembly Forestモデル(DAF)を提案します。ディープフォレストのパラダイムに基づくDAFは、特徴学習およびスケーラブルな学習における本質的な制約に対処し、効果的な拡散生成画像検出器となります。既存のDNNベース手法と比較して、DAFはパラメータ数が大幅に少なく、計算コストも大幅に低いため、GPUなしでデプロイできる一方で、標準的な評価プロトコルのもとで競争力のある性能を達成します。これらの結果は、提案手法が、資源が限られた状況において重厚なDNNモデルの実用的な代替となり得る強い可能性を示しています。コードとモデルは https://github.com/OUC-VAS/DAF で公開されています。