要旨: 本研究では、動的な視覚環境において、異なる視覚情報源が人間の意思決定にどのように寄与するかを調べます。同期された眼球運動計測を備えた大規模なAtariゲームデータセットであるAtari-HEADを用いて、周辺視覚情報の寄与、視線マップの形での明示的な視線情報、そして人間の行動に由来する過去状態情報の寄与を逆推定する手段として、制御されたアブレーション(除去)フレームワークを導入します。私たちは、これらの情報源を選択的に含めたり除外したりする6つの設定のもとで、行動予測ネットワークを訓練します。20のゲームにわたって周辺情報は突出して最も強い寄与を示し、除去した場合の予測精度の中央値の低下は35.27〜43.90%の範囲に及びます。視線情報による低下は2.11〜2.76%とより小さく、過去状態情報の低下は1.52〜15.51%と幅広い範囲に分布します。上限側の値は、周辺情報の漏れが低減されることによって、より情報量が多い可能性が高いです。集計された精度に加えて、異なるモデル設定によって割り当てられた真の行動確率にもとづいて状態をクラスタリングします。この分析により、注意(フォーカス)に支配される状態、周辺に支配される状態、そしてより文脈に依存した意思決定状況といった粗い行動レジームが特定されます。これらの結果は、Atariにおける人間の意思決定が、視線の現在のフォーカス以外の情報に強く依存していることを示唆しています。また提案するフレームワークは、行動からこのような情報源の寄与を推定するための手段を提供します。
Atariゲームにおける人間の意思決定への中心視・周辺視・時間的(過去状態)視覚情報の寄与の推定
arXiv cs.LG / 2026/4/7
📰 ニュースSignals & Early TrendsIdeas & Deep AnalysisModels & Research
要点
- 本論文は、動的なAtari環境において、中心視(視線に焦点を当てた)・周辺視・時間的(過去状態)な各視覚情報源が、人間の意思決定にそれぞれどのように寄与するのかを調査する。
- 同期されたアイトラッキングを備えたAtari-HEADデータセットを用いて、著者らは制御されたアブレーション(情報の除去)フレームワークを適用し、含める/除外する情報源の組み合わせを変えながら行動予測ネットワークを訓練する。
- 20本のAtariゲームにわたる結果では、周辺視覚情報が支配的な寄与を示し、これを除去すると行動予測精度の中央値が最も大きく低下する(約35〜44%)。
- 視線に由来する情報による精度低下はより小さい(約2〜3%)一方で、過去状態情報の影響範囲はより広い(約2〜16%)。影響の大きさは、周辺情報の「漏れ(peripheral-information leakage)」が減少することと関連している可能性が高い。
- モデルが予測する行動確率に基づいて状態をクラスタリングすることで、焦点が支配する意思決定や周辺が支配する意思決定といった行動レジームを特定し、視覚情報源の寄与を行動から推定するための一般的手法を提案する。


