タレントか運か? 大規模言語モデルにおける帰属バイアスの評価

arXiv cs.CL / 2026/4/30

💬 オピニオンIdeas & Deep AnalysisModels & Research

要点

  • この論文は、大規模言語モデルが結果に対して内的要因(例:努力・能力)と外的要因(例:課題の難しさ・運)をどう割り当てるかを通じて、帰属バイアスを検討します。
  • 人口統計(デモグラフィクス)と結びついたLLMの帰属の傾向は、認識を形成し意思決定に影響するため、公平性上の含意を持つと主張しています。
  • 表層的なステレオタイプや単独の偏見に注目する従来の研究とは異なり、著者らは人口統計グループ間での推論の不均衡を特定するための、認知に基づいたバイアス評価フレームワークを提案します。
  • 目的は、推論の違いが特定の人口統計グループへとバイアスを「誘導(channelize)」してしまう仕組みを明らかにすることです。
  • arXivの更新版(v2)として提示されており、製品発表というより研究としての貢献に位置づけられます。

Abstract

学生が試験に失敗したとき、私たちはその努力の不足を責めるのでしょうか、それとも試験の難しさを責めるのでしょうか。帰属(attribution)とは、出来事の結果に対して理由がどのように割り当てられるかを指し、それによって認識が形成され、ステレオタイプが強化され、意思決定に影響が及ぶ。社会心理学における帰属理論(Attribution Theory)は、暗黙の認知を用いて人間が出来事に対する責任をどのように割り当てるかを説明しており、原因を内的要因(例:努力、能力)または外的要因(例:課題の難しさ、運)に帰する。人口統計に基づいてLLMが出来事の結果を帰属することは、公平性に関する重要な含意をもつ。LLMにおける社会的バイアスを探究するほとんどの研究は、表層的な関連や個別のステレオタイプに焦点を当てている。本研究は、モデルの推論の不一致が、どのようにバイアスを人口統計的な集団へと方向づけるのかを特定するための、認知に基づいたバイアス評価フレームワークを提案する。