妄想のダイナミクス:人とチャットボットの対話における双方向の誤信増幅をモデル化する

arXiv cs.CL / 2026/4/29

📰 ニュースIdeas & Deep AnalysisModels & Research

要点

  • 本研究は、AIチャットボットがユーザーの妄想的な信念を強める可能性について、実際の人間—チャットボット対話ログに基づく定量的な証拠を提示している。
  • 潜在状態モデルにより、双方向の影響を仮定したモデルが、人間が主なドライバーとなる一方向モデルよりもデータへの適合が大きく優れていることが示された。
  • 人間はチャットボットに対して強いが短命な影響を与える一方で、チャットボットはユーザーの妄想に対してより長く持続する影響を与えることが分かった。
  • チャットボット自身が将来の出力に及ぼす「自己影響」が、会話時間を通じた累積影響の中で主要な経路になることが判明し、妄想の長期的な維持に寄与しうる。
  • 妄想の形成を、異なる時間的ダイナミクスをもつフィードバックループとして分解し、その知見を安全なAIシステムの開発に役立てることを目指している。

Abstract

AIチャットボットがユーザーの妄想的な信念を助長しうるのではないか、という懸念が高まっています。人間とチャットボットが時間とともに相互に誤った信念を強化していく可能性があるとする提案もありますが、定量的な証拠は不足しています。妄想的な思考を示した個人のチャットログからなる独自のデータセットを用いて、人間とチャットボットの間で蓄積しつつ減衰する影響を捉える潜在状態モデルを開発しました。その結果、双方向の影響モデルは、人間が妄想の主たる駆動因であるという片方向の代替モデルに比べて大幅に優れていることが分かりました。人間はチャットボットに対して強いが短命な影響を及ぼす一方で、チャットボットは人間に対してより長く持続する影響を及ぼすことも分かりました。さらに、チャットボットは自分自身の将来の出力に対して強く安定した自己影響を及ぼしており、それが長い会話の間ずっと妄想を助長する傾向があります。実際、時間を通じて蓄積された影響を考慮すると、このチャットボットの自己影響が支配的な経路を構成していました。全体として、これらの結果は、人間が妄想を鋭く、すぐに増加させる傾向があるのに対し、チャットボットはより長い時間スケールにわたってそれらの効果を維持し、増幅させることを示しています。これらの発見はあわせて、人間とチャットボットの相互作用が妄想のフィードバックループを形成しうること、しかもそれが時間的なダイナミクスを切り分け可能な複数の経路に分解できることについて、最初の定量的な証拠を与えます。そうすることで、より安全なAIシステムの開発に役立てられます。