FED-Bench: 顔表情編集の非混和的評価のためのクロス・グラニュラー・ベンチマーク

arXiv cs.CV / 2026/4/1

💬 オピニオンSignals & Early TrendsIdeas & Deep AnalysisModels & Research

共有:

要点

FED-Benchは、アイデンティティと背景を保持しつつ微細な制御を可能にすることを目的とした、新しい顔表情画像編集ベンチマークとして提案されており、従来のベンチマークの限界に対処する。
このベンチマークは、カスケード型の拡張可能なパイプラインによって構築された747の「オリジナル–指示文–正解（グラウンドトゥルース）」トリプルを含み、より厳密で指示に忠実な評価を可能にする。
FED-Scoreと呼ばれる新しい評価プロトコルでは、スコアリングを3つの次元—Alignment（指示への追従）、Fidelity（画像品質とアイデンティティ保持）、Relative Expression Gain（表情変化の大きさ）—に分離し、システム的な指標バイアスを低減する。
18の編集モデルにわたる実験では、モデルは一般に、高い忠実度（fidelity）と正確な表情操作を同時に達成できないことが示され、微細な指示追従が主なボトルネックとして特定される。
著者らは、コードと、顔表情編集のための2万件超のin-the-wild学習セットを公開する予定でもあり、ベースラインモデルを微調整することで大きな改善が得られることを示している。