大規模言語モデルは文化的に偏った基準を通して都市を認識する

arXiv cs.CL / 2026/4/23

📰 ニュースIdeas & Deep AnalysisModels & Research

要点

  • 研究では、バランスの取れた世界のストリートビュー・サンプルと「文化的に中立な」プロンプト/「地域の文化的立場」を呼び出すプロンプトを用いて、最先端のLLMが都市を中立に記述するかを検証しています。
  • その結果、「中立」条件は実際には中立ではなく、ヨーロッパや北アメリカに関連するプロンプトは、多くの非西洋のプロンプトよりも基準(ベースライン)に系統的に近い出力を保つことが示されました。
  • 文化的なプロンピングは記述だけでなく情動的な評価も変え、特定のアイデンティティに対して感情ベースの“内集団”優位を生むことがあります。
  • 文化的に近いプロンピングは人間の記述との整合をある程度改善するものの、人間のセマンティック多様性を完全には取り戻せず、しばしば感情的に高揚した文体も温存されます。
  • 総じて、LLMは「どこにも属さない」形で都市を知覚するのではなく、文化的に不均一な参照枠を通して知覚しており、その参照枠が“普通”“馴染み”“肯定的に価値づけられるもの”を形作ると結論づけています。

要旨: 大規模言語モデル(LLM)は、場所を説明し、評価し、解釈する用途でますます使われるようになっているが、それが文化的に中立な観点から行われているのかどうかは依然として不明である。ここでは、バランスの取れたグローバルなストリートビューのサンプルと、いずれも中立であり続けるプロンプト、または異なる地域の文化的観点を想起させるプロンプトを用いて、最先端のLLMにおける都市の知覚を検証する。自由記述の記述と、構造化された場所の判断の両方において、中立条件は実際には中立ではないことが判明した。ヨーロッパおよび北アメリカに関連づけられたプロンプトは、多くの非西洋系のプロンプトよりも体系的にベースラインに近いままであり、モデルの知覚が、普遍的な参照枠というよりは、文化的に偏った参照枠を中心に編成されていることを示している。文化的なプロンプトは情動的評価も変化させ、一部の促されたアイデンティティに対して、感情に基づく内集団の選好を生み出した。地域ごとの人間のテキスト-画像ベンチマークとの比較では、文化的に近いプロンプトは人間の記述との整合性を高めうることが示されたが、それでも人間が持つレベルの意味的多様性は回復されず、またしばしば感情的に高められたスタイルが維持された。安全、美しさ、豊かさ、活気、退屈、抑うつに関する構造化された判断でも、同じ非対称性が再び現れた。そこでは、モデルの出力は解釈可能であるものの、人間の集団間の差異を部分的にしか再現できなかった。これらの結果は、LLMが単に「どこからでもない場所」から都市を知覚しているわけではないことを示唆している。そうではなく、何が普通で、馴染みがあり、そして前向きに価値づけられて見えるかを形作る、文化的に偏ったベースラインを通して知覚しているのである。