デフォルトでの分極化:LLMベースのコンテンツキュレーションにおけるレコメンドバイアスの監査
arXiv cs.CL / 2026/4/20
💬 オピニオンSignals & Early TrendsIdeas & Deep AnalysisModels & Research
要点
- LLMを用いたコンテンツのキュレーションやランキングにおいて、ソーシャルメディア投稿(Twitter/X、Bluesky、Reddit)を対象に、バイアスがどのように生じるかを監査する研究である。
- 6種類のプロンプト戦略と3つの主要プロバイダ(OpenAI、Anthropic、Google)で、100投稿プールからの上位10件選択を54の実験条件で合計540,000回シミュレーションした結果、バイアスにはプロンプト設計に対して頑健なものと敏感なものがあることが示された。
- すべての構成で分極化が増幅され、毒性(トキシシティ)の扱いは「エンゲージメント重視」と「情報重視」のプロンプト間で強い反転が見られ、感情(センチメント)バイアスは概ねネガティブである。
- プロバイダ間ではトレードオフが異なり、GPT-4o Miniはプロンプト間で最も挙動が一貫し、ClaudeとGeminiは毒性対応で高い適応性を示し、Geminiはネガティブな感情を最も強く好む。
- Twitter/Xでは、政治的傾向に関するバイアスが最も明確な属性シグナルとなり、候補プールで右派が最大でも、選択結果では左派の著者が体系的に過剰に表れる状態がプロンプトを変えても概ね持続する。



