フレーム間特徴差分による微表情対応アバター・フィンガープリンティング
arXiv cs.CV / 2026/4/28
📰 ニュースIdeas & Deep AnalysisModels & Research
要点
- 本論文は、合成のトーキングヘッド動画が誰によって生成・操作されたかを検証するアバター・フィンガープリンティング手法を提案し、リアルか偽物かではなく運転者(ドライバー)本人の同一性に焦点を当てています。
- 固定的で微分不可能なランドマーク抽出に代えて、前処理不要のパイプラインとして、生の動画フレームを直接入力し微表情対応バックボーンを用いる仕組みを採用しています。
- 中核となる手法は、深い特徴空間で連続フレームの特徴マップを差分(減算)するフレーム間特徴差分であり、時間的に安定した見た目の手がかりを相殺しつつ、運転者固有の動きのダイナミクスを保持します。
- NVFAIRでのアブレーション実験では、識別に寄与する主要因が時間的なモーションであること、また生の外観特徴が同一性の分離を悪化させ得ることが示されています。
- 提案手法はNVFAIRで全体AUC 0.877を報告し、ランドマークベースのベースラインに対して多くのクロス・ジェネレータ評価で同等以上の性能を示しています。




