AIは美術史家のように見るのか? 視覚と言語モデルが芸術的スタイルを認識する仕組みの解釈
arXiv cs.CV / 2026/3/12
📰 ニュースIdeas & Deep AnalysisModels & Research
要点
- 本論文は、視覚と言語モデルが芸術的スタイルを予測する方法と、それらの推論が美術史家の基準と一致するかどうかを調査する。
- 潜在空間分解アプローチを用い、定量的評価、因果分析、および美術史家による評価を組み合わせて、推進概念を特定する。
- 抽出された概念の73%が美術史家によって一貫性があり、意味論的に有意義な視覚的特徴を示すと判断され、特定の芸術作品のスタイルを予測するために使用された概念の90%が関連性があると判断された。
- 関連性の薄い概念がスタイル予測に寄与したケースでは、美術史家はその成功の可能性のある理由として、モデルが暗/明の対比といったより形式的な特徴を用いている可能性がある、等を挙げ、AIと人間の美術判断の解釈可能性のギャップを浮き彫りにしている。