短いチャットボットとのやり取りは人の道徳的価値観に持続的な変化をもたらす

arXiv cs.AI / 2026/4/25

📰 ニュースSignals & Early TrendsIdeas & Deep AnalysisModels & Research

要点

  • 新しいarXivの研究は、短い指示型のAIチャットボット会話が参加者の道徳的評価を変え得るかを検証し、チャットボットと対照との間で被験者内デザインを用いて調べました。
  • その短時間の会話は、より厳格な基準を受け入れることや、より大きな寛容を主張することを含む形で、道徳判断に有意な変化を生み、2週間の追跡で効果がさらに強まることが示されました。
  • 対照条件では有意な変化が見られず、観察された効果が会話そのものではなく、チャットボットが与えた促し(指示)によって生じたことを示唆しています。
  • 操作は説得の意図に気づかないまま成立し、処罰に関する判断には広がらない一方で、チャットボットと対照は好意度や説得力の評価が同程度でした。
  • 本結果は、AIが影響を与える対話によって、基礎的な道徳的価値観が検知されない形で、かつ持続的に変えられる脆弱性があることを示し、チャットボットが倫理観を誘導し得る点で懸念を提起しています。

要旨: 道徳判断は、人間の社会的行動と社会システムの基盤を形成する。人工知能チャットボットがますます個人的な助言者として利用されるようになっている一方で、道徳判断への影響はほとんど未解明のままである。本研究では、被験者内の自然主義的パラダイムを用いて、指示型AIとの会話が道徳評価を変化させるかどうかを検討した。53名の参加者が道徳的シナリオを評価した後、道徳判断を変えるようプロンプトされたチャットボットと4回、対照エージェントと4回、それぞれ議論した。短時間の会話は、より厳格な基準の受容と、より大きな寛容の主張の両方において、有意な方向性のある変化を引き起こした(p < 0.05; Cohen's d = 0.735-1.576)。さらにこの効果は、2週間の追跡期間中に強まる傾向がみられた(Cohen's d = 1.038-2.069)。重要な点として、対照条件では変化は生じず、参加者が説得意図に気づかないままであった場合には、懲罰には効果が及ばなかった。また、両エージェントは同程度に好感が持て、説得力があると評価されており、検出されないまま持続的に、基礎となる道徳的価値を操作されうる脆弱性が示唆される。