スコアとテキストを切り離す:査読におけるポライトネスの原理
arXiv cs.LG / 2026/4/17
💬 オピニオンIdeas & Deep AnalysisModels & Research
要点
- 本論文は、30,000件超のICLR投稿(2021〜2025年)を対象に、数値スコアと自由記述の査読文の間で予測力を比較し、著者がフィードバックを誤解しやすい理由を検証します。
- 数値ベースのモデルは約91%の精度に達する一方、テキストベースのモデルは約81%で、LLMを用いても差が大きいことから、テキスト情報の信頼性が相対的に低いと示されています。
- 数値ベースのモデルが外すケースでは、スコア分布に高い尖度と負の歪度が見られ、平均が境界付近でも「個別の低いスコア」が採否を決定的に左右することが示唆されます。
- 感情分析の観点では、テキストの弱い信号はポライトネスの原理によるものだと説明されます。つまり、不採択となった論文の査読文にはポジティブな語がネガティブより多く含まれ、不採択の手がかりが隠れてしまうのです。



