大規模言語モデルにおける性別推論での文脈的一貫性（コンテクスチュアル・インバリアンス）の破れ

arXiv cs.CL / 2026/3/25

💬 オピニオンSignals & Early TrendsIdeas & Deep AnalysisModels & Research

共有:

要点

本論文は、LLM評価において一般的に仮定される「文脈的に同等な言い換えに対して出力が安定している」という前提を検証し、特に性別推論に焦点を当てる。
理論的に情報を与えない最小限の談話文脈を用いた代名詞選択実験において、研究者らは、非文脈設定（デコンテクスチュアル化）と比べて、モデル出力に大きな体系的な変化が生じることを見いだす。
単純な設定で観測される文化的ステレオタイプとの相関は、文脈を追加すると弱まるか消失する一方で、無関係に見える特徴（例：無関係な参照対象に結び付いた代名詞の性別）が、予想外にも情報として働くことがある。
Contextuality-by-Default（文脈性によるデフォルト）の分析を用いて、本研究は、周辺的な文脈効果や代名詞の繰り返しによって説明できる範囲を超えて、19〜52%のケースで文脈依存が持続すると報告している。
著者らは、文脈的一貫性のこれらの違反が、バイアスのベンチマーク手法や、ハイステークス環境でのLLMの展開方法に直接的な影響をもたらすと主張する。

note

note

note

note

note