役割が破綻する時:LLMベースの政治的発言分析における支持者ロール整合性の認識論的制約
arXiv cs.AI / 2026/5/1
📰 ニュースIdeas & Deep AnalysisModels & Research
要点
- 本論文は、多数の評定役を持つマルチエージェントLLMによる政治的ディスコース分析で、「割り当てられた敵対的な支持者ロールをモデルが確実に維持する」という前提をTRUSTパイプラインで初めて体系的に検証する。
- 推論テキストから語彙の表面に頼らず支持者ロールを判定する認識論的立場分類器を提案し、60件の政治的発言(英語30・ドイツ語30)に対してRDIやERSなど4指標でロール整合性を評価する。
- ロール破綻の失敗モードとして、事実確認結果が「正当化側ロール」を維持できる下限を作るEpistemic Floor Effectと、訓練時の知識が役割指示を上書きしてしまうRole-Prior Conflictを特定し、いずれもEpistemic Role Override(ERO)という単一メカニズムで説明できることを示す。
- ロール整合性はモデルや構成要素の選択に大きく左右され、Mistral LargeはClaude Sonnetより28pp高い(67% vs. 39%)一方で、Claudeは対立する立場へ能動的に切り替わるのに対しMistralは極性反転を伴わない「ロール放棄」という質的に異なる失敗形を示す。
- 役割整合性の測定を伴わないマルチエージェントLLMのバリデーションは、システムが意図した「認識論的多様性」を系統的に誤って表現しうる、と著者らは警告する。




