CLPIPS:AI生成画像の類似度のためのパーソナライズされた指標
arXiv cs.CV / 2026/4/3
💬 オピニオンIdeas & Deep AnalysisModels & Research
要点
- 本論文では、テキストから画像を生成するワークフローにおいて、人間が感じる類似度の判断により合致することを目的とした、LPIPS画像類似度指標のパーソナライズ拡張であるCLPIPSを提案する。
- 既存の類似度指標(例:LPIPS、CLIP)は、文脈に依存しユーザー主導のタスクでは、人間の知覚とズレる可能性があると主張し、それを受けて指標の適応(メトリクスの改良)が動機づけられる。
- CLPIPSは、人間が順位づけした画像ペアを用いてマージンランキング損失で微調整される。モデル全体ではなく、LPIPSのレイヤー結合(組み合わせ)の重みのみを更新する。
- 繰り返し型の人間研究に基づく実験では、Spearman順位相関と級内相関(intraclass correlation)によって測定されるように、指標の出力と人間の順位との整合性が改善することが示される。
- 著者らは、類似度指標を、軽量な人間支援によるチューニングによって改善できる、人間を介した適応的なコンポーネントとして位置づける。単に絶対的な指標スコアの向上を追い求めるのではない。




