1つのモデル、二つの思考: 統一された画像品質評価と美的評価のためのタスク条件付き推論

arXiv cs.CV / 2026/3/23

📰 ニュースIdeas & Deep AnalysisModels & Research

共有:

要点

著者らは、IQA と IAA を単一の推論戦略で統合することの根本的な不一致を指摘する。IQA は簡潔で低レベルな知覚的手掛かりに依存する一方、IAA には熟慮的な意味論的判断が必要である。
視覚-言語のバックボーンを共有する統一フレームワークである TATAR を提案し、各タスクの性質にポストトレーニングで条件付けを行う。
TATAR は、高速・低遅延のタスク特異的推論構築、二段階の SFT+GRPO 学習を用いて報酬の精練を行う前にタスク認識に基づく事前情報を確立する、そして IQA にはガウス分布に基づくスコア整形を、IAA には Thurstone 式の完了ランキングを適用する非対称報酬を組み合わせる。
ドメイン内およびドメイン間の設定において、TATAR は両タスクで従来の統一ベースラインを一貫して上回り、タスク特化モデルと競争力を維持し、美学評価の学習ダイナミクスをより安定させる。
TATAR のコードは著者の GitHub リポジトリで公開されています。

日経XTECH

日経XTECH

日経XTECH

日経XTECH

日経XTECH