緊急時の警察ディスパッチにおけるAIの人口統計バイアス監査:11の大規模言語モデルのクロスリンガル評価
arXiv cs.CL / 2026/5/5
📰 ニュースSignals & Early TrendsIdeas & Deep AnalysisModels & Research
要点
- 本論文は、緊急時の警察ディスパッチにおける人口統計バイアスを評価するため、LLMの監査フレームワークを提案し、警察優先度ディスパッチシステムを5段階の順序分類タスクとして定式化しています。
- 19,800件の出力(11の最先端LLM)を、シナリオ対、人口統計の手がかりタイプ(宗教的外見、性別、人種)、および2言語(英語と北京語)にわたって分析した結果、バイアスは事件の重大度が曖昧な場合に系統的に現れ、通話内容から優先度が明確な場合は概ね減少することが示されました。
- バイアスの強さは属性ごとに異なり、最も大きい影響は宗教的外見で、その次が性別、最後が人種であり、リスクは属性間で一様ではないことが示されています。
- 別言語間での非対称性も確認され、性別バイアスは北京語で増幅される一方、人種バイアスは英語でより顕著であり、さらに一部のシナリオでは逆方向の効果も見られて単純なステレオタイプ増幅の説明では捉えにくい結果になっています。
- 著者らは、バイアスはモデル単体の固定的な性質ではなく、人口統計的手がかり・文脈上の曖昧さ・言語の相互作用として生じると主張し、候補モデルを実運用前に評価するためのスケーラブルな監査基盤も提示しています。




