要旨:
大規模言語モデル(LLMs)は最近、世論シミュレーションの合成エージェントとして採用されており、費用が高く時間のかかる人間調査に代わる有望な選択肢を提供しています。
そのスケーラビリティにもかかわらず、現在のLLMベースのシミュレーション手法は社会的多様性を捉えきれず、集団間の差異を平坦化し、人口統計グループ内の回答を過度に均質化する。
この制限を、LLMの隠れ表現における多様性崩壊現象として特定します。異なる社会的アイデンティティが層をまたいでますます見分けがつかなくなることです。
この観察に動機づけられ、私たちは Parametric Social Identity Injection (PSII) を提案します。これは、人口統計属性と価値志向の明示的でパラメトリックな表現を、LLMs の中間の隠れ状態に直接注入する一般的なフレームワークです。プロンプトベースのペルソナ条件付けとは異なり、PSII は表現レベルでの細かなかつ制御可能なアイデンティティの調整を可能にします。
複数のオープンソースLLMを用いたWorld Values Surveyでの広範な実験は、PSII が分布忠実度と多様性を有意に改善し、現実の調査データへのKL発散を低減しつつ、全体的な多様性を高めることを示しています。コードとデータは https://github.com/halsayxi/PSII で入手できます。
公衆世論シミュレーションにおけるパラメトリック・ソーシャル・アイデンティティ注入と多様化
arXiv cs.CL / 2026/3/18
📰 ニュースIdeas & Deep AnalysisModels & Research
要点
- 本論文は、LLMベースの公衆世論シミュレーションにおいて、層間で社会的アイデンティティが識別不能になる“多様性崩壊現象”を特定する。
- PSII(パラメトリック・ソーシャル・アイデンティティ注入)と呼ぶ枠組みを提案し、LLMsの中間隠れ状態に明示的な人口統計属性と価値指向を注入する。
- PSIIは、従来のプロンプトベースのペルソナ条件付けとは異なり、表現レベルでの細かな、制御可能なアイデンティティモジュレーションを実現する。
- World Values Surveyを用いた複数のオープンソースLLMを対象とする実験は、PSIIが分布適合性と多様性を改善し、実世界データとのKLダイバージェンスを低減することを示している。
- 本研究は、LLMエージェントの表現レベルでの制御に関する洞察を提供し、再現性のためのコードとデータをリンクされたGitHubリポジトリに公開している。
