要旨:
対話型AIシステムは個人的な自己省察や感情の開示にますます用いられており、脆弱なユーザーへの影響について懸念が高まっている。最近の逸話的な報告は、AIとの長時間の相互作用が妄想的思考を強化する可能性があることを示唆しており、この現象は時にAI精神病と表現される。しかし、この現象に関する実証的証拠は依然として限られている。本研究では、対話型AIとの複数ターンの相互作用において妄想関連の言語がどのように進化するかを検討する。Redditユーザーの縦断的投稿履歴からSimUsers(SimUsers)を構築し、3つのモデルファミリー(GPT、LLaMA、Qwen)と長時間の対話を生成する。DelusionScore(妄想スコア)と呼ばれる、会話の各ターンを通じた妄想関連の言語の強度を定量化する言語的指標を開発する。前もって妄想関連の言説を有するユーザーから派生したSimUsers(治療群)は、DelusionScoreの軌跡が徐々に上昇する一方、そうした言説を持たないユーザーから派生したSimUsers(対照群)は安定するか低下することを見出した。さらに、この増幅はテーマごとに異なり、現実への懐疑と強迫的推論が最も大きく増加することが示された。最後に、現在のDelusionScore(妄想スコア)に基づいてAIの応答を条件付けすることは、これらの軌跡を大幅に抑制する。これらの発見は、対話型AIの相互作用が長時間の使用にわたって妄想関連の言語を増幅し得るという実証的証拠を提供し、そのようなリスクを緩和するための状態認識型の安全機構の重要性を浮き彫りにしている。)
AIの精神病理:会話型AIは妄想関連の言語を増幅させるのか?
arXiv cs.AI / 2026/3/23
💬 オピニオンSignals & Early TrendsIdeas & Deep AnalysisModels & Research
要点
- 本研究は Reddit の縦断的履歴に由来する SimUsers を用い、GPT、LLaMA、Qwen の3つのモデルファミリとの長時間の対話をシミュレートする。
- DelusionScore(デリュージョンスコア)という、対話のターンを通じて妄想関連の言語を定量化する言語的指標を導入する。
- 発見: 妄想関連の談話を事前に持つ SimUsers(治療群)は DelusionScore の推移が徐々に増加する一方、対照群の推移は安定するか低下する。
- 妄想の増幅はテーマによって異なり、現実性に対する懐疑と強迫的推論が最も大きく増加する。
- 現在の DelusionScore に基づいて AI の応答を条件付けることは、これらの軌跡を著しく抑制し、状態認識型の安全機構の必要性を強調している。




