Sima AIunty：LLM駆動のマッチメイキングにおけるカースト監査

arXiv cs.CL / 2026/4/1

💬 オピニオンSignals & Early TrendsIdeas & Deep AnalysisModels & Research

共有:

要点

本論文は、カーストと収入水準が多様な実在の結婚向けプロフィールを用いて、LLMを媒介するマッチメイキングにおいて大規模言語モデルがカーストをどのように評価するかを統制的に監査した。
5つのLLMファミリー（GPT、Gemini、Llama、Qwen、BharatGPT）に対し、カースト集団（バラモン、クシャトリヤ、ヴァイシャ、シュードラ、ダリット）間で、社会的受容性、結婚の安定性、文化的適合性を判断するようプロンプトを与えた。
結果は、モデル間で一貫した階層的バイアスが見られることを示しており、同一カーストの組み合わせが最も高く評価され、異カーストの組み合わせは伝統的なカースト階層に従って順位付けされていた。
本研究では、同一カーストと異カーストの評価の間で最大25%の好意度差が報告されている（10点尺度）。これは、LLMが根深い社会的階層化を再現し得ることを示唆する。
著者らは、マッチメイキングのような社会的にセンシティブな意思決定領域で、AIシステムが排除を強化しないようにするため、文化的に根ざした評価および介入戦略を提唱している。

Abstract

恋愛の引き合わせのような関係領域における社会的・個人的な意思決定は、文化的規範や歴史的な序列と深く結びついており、互換性・受容性・安定性に関するアルゴリズムおよびAIによる評価によって形づくられる可能性があります。南アジアの文脈では、カーストは婚姻に関する意思決定の中心的な要素であり続けていますが、このような状況において、現代の大規模言語モデル（LLM）がカーストに基づく階層化をどのように再現するのか、あるいはどのように破壊するのかについてはほとんど分かっていません。本研究では、実世界の結婚（マトリモニアル）プロフィールを用いて、LLMが仲介するマッチメイキング評価におけるカースト偏見を統制された形で監査します。バラモン、クシャトリヤ、ヴァイシャ、シュードラ、ダリトの間でカーストのアイデンティティを変え、さらに所得を5つの区分にわたって変化させ、5つのLLMファミリー（GPT、Gemini、Llama、Qwen、BharatGPT）を評価します。モデルには、社会的受容、婚姻の安定性、文化的適合性という次元に沿ってプロフィールを評価するようプロンプトを与えます。分析の結果、モデル間で一貫した階層的パターンが明らかになりました。つまり、同一カースト同士のマッチは最も好意的に評価され、カーストをまたぐマッチよりも平均評価が最大で25%高くなります（10点満点スケール）。そして、カーストをまたぐマッチは、さらに伝統的なカーストの序列に従って並べ替えられています。これらの知見は、既存のカースト階層がLLMの意思決定においてどのように再現されるかを示すものであり、社会的にセンシティブな領域に投入されるAIシステムが歴史的な排除の形を強化してしまうリスクがあることを踏まえ、文化的に根ざした評価および介入戦略の必要性を強調するものです。