人間のパーソナリティ特性・社会人口統計・ソーシャルメディア行動を“影”として捉えながら、LLMが社会問題について討論する様子をマッピングする

arXiv cs.CL / 2026/5/1

📰 ニュースDeveloper Stack & InfrastructureModels & Research

要点

  • 本稿は、「Cognitive Digital Shadows(CDS)」と呼ばれる合成データセット(19万件)を提案し、ペルソナや文脈に条件付けされたプロンプトによってLLM生成文がどのように変わるかを分析できるようにする。
  • CDSは19種類のLLMを用いて作成され、各出力は「人間のペルソナ」または「AIアシスタント役」をシャドーするようにモデルへプロンプトを与えて生成される。
  • データセットは、ワクチン/医療、ソーシャルメディア上の偽情報、科学におけるジェンダーギャップ、STEM分野のステレオタイプという4つの論争的な社会トピックを扱い、17の社会人口統計・心理属性をエンコードして、プロンプト、言語、立場、推論の関係を追えるようにしている。
  • 生成文はトピックへのアンカー付けについて検証されており、解釈可能なNLP(例:テキストの“forma mentis”ネットワーク)を使った感情分析にも活用できる。
  • ペルソナ、トピック、モデル間で感情的・意味論的なフレーミングをグループ単位で比較できる、ユーザーフレンドリーなダッシュボード付きのプーリング・プラットフォームも用意されており、将来的なバイアスや社会的感度、アラインメントの監査に役立つ。

Abstract

大規模言語モデル(LLM)は社会的言説を強く形作り得る一方で、制御された社会的・文脈的プロンプトにわたってLLMの出力がどのように変動するかを調べるデータセットは、依然として乏しい。認知デジタルシャドウ(Cognitive Digital Shadows: CDS)は、LLMが生成した言説の分析を支える190,000件の合成コーパスである。CDSの各レコードは19個のLLMのいずれかによって生成され、人間のパーソナ(個人としての人格)またはAIアシスタントの役割のいずれかをシャドウするようにプロンプトされる。CDSには、4つの物議を醸す社会トピックに関するLLMの応答が含まれる:ワクチン/ヘルスケア、ソーシャルメディアにおける誤情報、科学におけるジェンダー・ギャップ、STEMにおけるステレオタイプである。パーソナ条件付けレコードは17の社会人口学的および心理学的属性をエンコードしており、LLMのプロンプト、言語、スタンス、推論を結び付けるデータを提供する。テキストはトピックのアンカー付けについて検証されており、解釈可能なNLP(例:テキストのフォーマ・メンティス・ネットワーク)を通じて感情分析を支援できる。CDSは、ユーザーフレンドリーなダッシュボードを備えたプーリング(集約)プラットフォームによって強化されており、パーソナ、トピック、モデル間での感情的・意味論的な枠組み付けを、容易かつ対話的にグループ単位で比較できる。CDSのプロンプト枠組みは、今後のLLMのバイアス、社会的感受性、アラインメント(整合性)に関する監査を可能にする。