SPAGBias:大規模言語モデルにおける構造化された空間的ジェンダーバイアスの発見と追跡
arXiv cs.CL / 2026/4/17
📰 ニュースIdeas & Deep AnalysisModels & Research
要点
- この論文は、都市計画のような文脈で使われる大規模言語モデルに対して、空間的ジェンダーバイアスを評価するための体系的フレームワーク「SPAGBias」を提案しています。
- SPAGBiasは、62の都市ミクロ空間のタクソノミー、プロンプトライブラリ、そして3つの診断レイヤー(明示的:強制選択の再サンプリング、確率的:トークン単位の非対称性、構築的:意味・物語上の役割分析)を組み合わせています。
- 6つの代表的モデルを用いた実験では、公的空間と私的空間の区分を超えて、きめ細かなミクロレベルのジェンダーと空間の関連が見つかり、「空間的ジェンダーニャラティブ」の生成に影響することが示されています。
- さらに、プロンプト設計、温度(temperature)、モデル規模がバイアスの表れ方に影響し、追跡実験ではそのパターンがモデルの学習パイプライン(事前学習、指示チューニング、報酬モデリング)を通じて強化されている可能性が示され、現実の分布を大きく上回る関連が観測されています。
- 下流タスクの評価では、このバイアスが規範的・記述的の両方の適用設定で具体的な失敗につながり得ることが明らかにされ、ジェンダー化された空間に関する社会学的理論と計算的バイアス測定を結びつけています。



