テールの偏り:履歴書サマリーにおける名前条件付きの評価的フレーミングがLLM採用を不安定化させる仕組み

arXiv cs.CL / 2026/4/23

💬 オピニオンIdeas & Deep AnalysisModels & Research

要点

  • 本研究は、LLMが採用や給与に関して名前に基づく偏りを持つという既存知見に加え、下流の評価のためにLLMが候補者サマリーを生成する場面で、名前に条件づけられた評価的フレーミングが偏りを生むかを検証します。
  • 合成履歴書と実際の求人情報を用い、4モデルの生成サマリー約100万件を、レース・ジェンダーの名前を体系的に摂動させながら解析し、各サマリーを「履歴書に根ざした事実」と「評価的な言語」に分解して偏りの所在を特定します。
  • 事実に相当する内容は摂動間で概ね安定している一方で、評価的な言語には、分布の両端に偏って、名前に条件づけられた微妙な差が見られ、とりわけオープンソースモデルで顕著です。
  • 採用シミュレーションでは、評価的サマリーが、方向性のある不利益を「対称的な不安定性」へと変換し、従来の公平性監査をすり抜けうることが示され、LLM同士の自動化においてバイアスが伝播する可能性の経路を示唆します。

Abstract

研究により、LLMは採用や給与の推奨において「名前」に基づく偏りを示すことが報告されている。本論文ではその代わりに、LLMが下流の評価のための候補者サマリーを生成するという状況を扱う。大規模な統制実験において、4つのモデルが人種と性別の名前の摂動を体系的に受けたもとで生成した、合計ほぼ100万件の履歴書サマリーを、合成の履歴書と実世界の求人情報を用いて解析する。各サマリーを履歴書に根差した事実的内容と、評価的な枠組みへと分解することで、事実的内容は概ね安定したままである一方、評価的な言語は、分布の両端に集中した、微妙な名前に条件づけられた変動を示すことを見いだす。特にオープンソースのモデルにおいて顕著である。採用のシミュレーションは、評価的なサマリーが方向性のある害を対称的な不安定性へと変換し、従来の公正性監査をすり抜けうることを示す。これは、LLMからLLMへと移る自動化バイアスの潜在的な経路を示唆するものである。