役割が破綻する時：LLMベースの政治的発言分析における支持者ロール整合性の認識論的制約

arXiv cs.AI / 2026/5/1

📰 ニュースIdeas & Deep AnalysisModels & Research

共有:

要点

本論文は、多数の評定役を持つマルチエージェントLLMによる政治的ディスコース分析で、「割り当てられた敵対的な支持者ロールをモデルが確実に維持する」という前提をTRUSTパイプラインで初めて体系的に検証する。
推論テキストから語彙の表面に頼らず支持者ロールを判定する認識論的立場分類器を提案し、60件の政治的発言（英語30・ドイツ語30）に対してRDIやERSなど4指標でロール整合性を評価する。
ロール破綻の失敗モードとして、事実確認結果が「正当化側ロール」を維持できる下限を作るEpistemic Floor Effectと、訓練時の知識が役割指示を上書きしてしまうRole-Prior Conflictを特定し、いずれもEpistemic Role Override（ERO）という単一メカニズムで説明できることを示す。
ロール整合性はモデルや構成要素の選択に大きく左右され、Mistral LargeはClaude Sonnetより28pp高い（67% vs. 39%）一方で、Claudeは対立する立場へ能動的に切り替わるのに対しMistralは極性反転を伴わない「ロール放棄」という質的に異なる失敗形を示す。
役割整合性の測定を伴わないマルチエージェントLLMのバリデーションは、システムが意図した「認識論的多様性」を系統的に誤って表現しうる、と著者らは警告する。

日経XTECH

Dev.to

ITmedia AI+

Dev.to

Dev.to