読解時間を探る

arXiv cs.CL / 2026/4/22

📰 ニュースModels & Research

要点

  • この論文は、5言語(英語、ギリシャ語、ヘブライ語、ロシア語、トルコ語)のアイトラッキングデータを用いて、言語モデル内部表現が人間の読解時間に関する認知的シグナルを持つかを検証する。
  • 正則化付き線形回帰によるプロービングで、各モデル層の表現を驚き度(surprisal)、情報量(information value)、logit-lens の驚き度などのスカラー指標と比較する。
  • 結果として、初期層の表現は一回目の注視や注視時間(gaze duration)といった初期の眼球運動指標を、驚き度よりもよく予測し、低レベルの語彙・構文情報が初期の人間の処理段階と整合している可能性を示す。
  • 一方で、総読解時間などの後期指標では、圧縮された表現であるにもかかわらず驚き度が依然として最良の予測因子となり、読解段階ごとに異なるメカニズムが示唆される。
  • さらに、最適な予測因子は言語と眼球運動メトリクスによって強く変化し、驚き度と初期層表現の組み合わせで性能が向上する。