大規模言語モデルを用いた道徳判断における文化的な多様性の探究
arXiv cs.AI / 2026/3/31
💬 オピニオンIdeas & Deep AnalysisModels & Research
要点
- 本研究では、大規模言語モデルが世界価値観調査(WVS)およびピュー・グローバル・アティチュード調査(PEW)で報告されている文化的に多様な道徳判断を反映しているかどうかを検証する。
- 研究者らは、ログ確率ベースの「道徳的正当化(moral justifiability)」スコアを算出し、多数の倫理トピックにわたってモデルの出力と調査結果を相関分析する。あわせて、より小規模な単言語/多言語モデルと、新しい指示チューニング済みモデルの両方を比較する。
- 先行世代の、あるいは小規模なモデルでは、人間の道徳判断との相関がほぼゼロ、または負になる傾向がある一方で、高度な指示チューニング済みモデルでは、相関が大幅に高い正の値を示す。
- 分析により、他の地域よりもW.E.I.R.D.(Western、Educated、Industrialized、Rich、Democratic:西洋・教育を受けた・工業化された・豊かな・民主的な国々)との整合性が強いことが明らかになり、文化間の感度が一様ではないことが示唆される。
- 本論文は、特定のトピックや地域における残された課題を議論するとともに、バイアスや学習データの多様性、情報検索への影響、そして文化的感度を高めるための示唆について、今回の知見を関連づけている。



