SPAGBias:大規模言語モデルにおける構造化された空間的ジェンダーバイアスの発見と追跡

arXiv cs.CL / 2026/4/17

📰 ニュースIdeas & Deep AnalysisModels & Research

要点

  • この論文は、都市計画のような文脈で使われる大規模言語モデルに対して、空間的ジェンダーバイアスを評価するための体系的フレームワーク「SPAGBias」を提案しています。
  • SPAGBiasは、62の都市ミクロ空間のタクソノミー、プロンプトライブラリ、そして3つの診断レイヤー(明示的:強制選択の再サンプリング、確率的:トークン単位の非対称性、構築的:意味・物語上の役割分析)を組み合わせています。
  • 6つの代表的モデルを用いた実験では、公的空間と私的空間の区分を超えて、きめ細かなミクロレベルのジェンダーと空間の関連が見つかり、「空間的ジェンダーニャラティブ」の生成に影響することが示されています。
  • さらに、プロンプト設計、温度(temperature)、モデル規模がバイアスの表れ方に影響し、追跡実験ではそのパターンがモデルの学習パイプライン(事前学習、指示チューニング、報酬モデリング)を通じて強化されている可能性が示され、現実の分布を大きく上回る関連が観測されています。
  • 下流タスクの評価では、このバイアスが規範的・記述的の両方の適用設定で具体的な失敗につながり得ることが明らかにされ、ジェンダー化された空間に関する社会学的理論と計算的バイアス測定を結びつけています。

Abstract

大規模言語モデル(LLM)は都市計画でますます活用されているが、ジェンダー化された空間理論が、ジェンダー階層が空間の編成の中にどのように埋め込まれるかを示していることから、LLMがこうしたバイアスを再現または増幅しうるのではないかという懸念がある。私たちは、LLMにおける空間的なジェンダーバイアスを評価するための最初の体系的フレームワークであるSPAGBiasを提案する。SPAGBiasは、62の都市のミクロ空間に関する分類体系、プロンプトライブラリ、そして3つの診断レイヤー(明示的:強制選択の再サンプリング、確率的:トークンレベルの非対称性、構築的:意味的および物語上の役割分析)を組み合わせている。6つの代表的なモデルをテストした結果、公私の二分法を超える、構造化されたジェンダー—空間の関連が確認され、きめ細かなミクロレベルの対応付けが形成されていることが分かった。物語生成では、感情、語り方(語彙の選び方)、そして社会的役割が共同で「空間におけるジェンダーの物語(spatial gender narratives)」をどのように形作るかが明らかになる。さらに、プロンプト設計、温度(temperature)、モデル規模がバイアス表現に与える影響も調べる。追跡実験により、これらのパターンはモデルのパイプライン(事前学習、指示チューニング、報酬モデリング)全体に埋め込まれ、強化されていることが示される。また、モデルが作る関連は、現実世界の分布を大幅に上回ることが分かった。下流の実験では、そのようなバイアスが、規範的な適用設定および記述的な適用設定の両方において具体的な失敗を引き起こすこともさらに明らかになった。本研究は社会学的理論と計算的分析を結びつけ、バイアス研究を空間領域へと拡張し、LLMが言語を通じて社会的なジェンダー認知をどのように符号化しているかを明らかにする。