物語の類似性予測のための資源としての多視点性(マルチパースペクティヴィティ)
arXiv cs.CL / 2026/3/24
💬 オピニオンIdeas & Deep AnalysisModels & Research
要点
- 本論文は、物語の類似性予測は本質的に解釈的であると主張する。同一テキストに対して複数の等しく妥当な読みがあり得るため、それに伴って類似度判断も変わりうる。これにより、単一の正解(単一のグラウンドトゥルース)に基づく意味ベンチマークが複雑化する。
- そこで、予測システムにこの「多視点性」を明示的に取り入れることを提案する。解釈の枠組みに精通した実務者タイプから一般向けのキャラクターまでを含む、31体のLLMパーソナ(人格)のアンサンブルを構築する。
- SemEval-2026 タスク4のデータセットでの実験により、この手法は精度0.705を達成し、アンサンブルのサイズを大きくするほど性能が向上することが示される。
- 本研究では、実務者パーソナは個別の精度が低い一方で、誤りの相関が小さいことが分かる。これが多数決によって大きな改善を生み、Condorcetの陪審員定理に類似した挙動と整合する。
- 誤り分析では、性別に焦点を当てた解釈語彙と精度の間に、パーソナのカテゴリ横断で負の関係があることが特定される。これは、ベンチマークの不整合、またはグラウンドトゥルース内に欠けている解釈の可能性を示唆する。
