広告

CLPIPS:AI生成画像の類似度のためのパーソナライズされた指標

arXiv cs.CV / 2026/4/3

💬 オピニオンIdeas & Deep AnalysisModels & Research

要点

  • 本論文では、テキストから画像を生成するワークフローにおいて、人間が感じる類似度の判断により合致することを目的とした、LPIPS画像類似度指標のパーソナライズ拡張であるCLPIPSを提案する。
  • 既存の類似度指標(例:LPIPS、CLIP)は、文脈に依存しユーザー主導のタスクでは、人間の知覚とズレる可能性があると主張し、それを受けて指標の適応(メトリクスの改良)が動機づけられる。
  • CLPIPSは、人間が順位づけした画像ペアを用いてマージンランキング損失で微調整される。モデル全体ではなく、LPIPSのレイヤー結合(組み合わせ)の重みのみを更新する。
  • 繰り返し型の人間研究に基づく実験では、Spearman順位相関と級内相関(intraclass correlation)によって測定されるように、指標の出力と人間の順位との整合性が改善することが示される。
  • 著者らは、類似度指標を、軽量な人間支援によるチューニングによって改善できる、人間を介した適応的なコンポーネントとして位置づける。単に絶対的な指標スコアの向上を追い求めるのではない。

広告