注視パターンは、ペアワイズのAI画像評価における嗜好と確信度を予測する

arXiv cs.AI / 2026/3/27

💬 オピニオンSignals & Early TrendsIdeas & Deep AnalysisModels & Research

要点

  • 研究は、RLHFやDPOのような「ペアワイズの嗜好学習」が、人の判断過程でどのように形成されるかをアイ・トラッキングで解明しようとしています。
  • 30人の参加者が1800試行でペアのAI生成画像を評価し、選好が決まる約1秒前に「選ばれた画像へ視線が移る」ガゼ・カスケード効果が再現されました。
  • 視線特徴は2値の選択を予測でき、選ばれた画像は滞在時間・注視・再注視が多い一方で、選好の形成に視線が関与していることが示唆されます。
  • さらに、視線遷移は高確信判断と不確実判断を識別でき、低確信では画像スイッチ頻度が高いことが報告されています。
  • これらより、アイ・トラッキングは選択だけでなく確信度の「暗黙シグナル」を提供し、より良い嗜好アノテーション品質に関係し得ると結論づけています。

Abstract

強化学習に基づく人間のフィードバック(RLHF)やダイレクト・パリファレンス最適化(DPO)といった嗜好学習手法は、ペアごとの人間の判断に依存していますが、これらの判断の背後にある認知プロセスについてはほとんど分かっていません。本研究では、眼球追跡が、ペアでのAI生成画像の評価中に嗜好形成を明らかにできるかどうかを検討します。30名の参加者が、視線を記録しながら1,800試行を完了しました。選択された画像へ視線が移ることで、意思決定の約1秒前に顕著な変化が現れる「視線カスケード効果」を再現しました。カスケードのダイナミクスは確信度の水準を問わず一貫していました。視線の特徴は二値の選択を予測しました(68%の精度)。選択された画像には、注視時間、注視回数、再訪がより多く割り当てられていました。視線の遷移は、高確信と不確実な判断を区別しました(66%の精度)。低確信の試行では、1秒あたりの画像切り替えがより多いことが示されました。これらの結果は、眼球のパターンが、ペアでの画像評価における選択と確信度の両方を予測できることを示しており、眼球追跡が嗜好アノテーションの質に関連する、暗黙のシグナルを提供しうることを示唆します。
広告