AI Navigate

共感は変化の原因ではなかった:GPTモデル世代間における心理的安全性の臨床評価

arXiv cs.AI / 2026/3/12

📰 ニュースIdeas & Deep AnalysisModels & Research

要点

  • 本研究は、OpenAIの3つのモデル世代(GPT-4o、o4-mini、GPT-5-mini)を、メンタルヘルスおよびAIコンパニオン領域における14の感情的に難しい対話シナリオに跨って比較し、臨床的に基づく6つの安全性評価基準を用いて2,100件の応答を評価した。
  • 共感スコアは3つのモデル間で統計的に区別できず、本評価において共感は世代間で差がないことを示した。
  • 安全性姿勢は変化した:危機検出はGPT-4oからGPT-5-miniへと単調に改善した一方、助言の安全性は低下し、有意なp値が報告された(危機検出:Kruskal-Wallis H=13.88, p=0.001、助言の安全性:H=16.63, p<0.001)。
  • ターンごとの軌跡分析は、最大の変化が対話の中盤の危機的瞬間に生じ、総計スコアには見えないことを明らかにした。
  • 未成年を含む自傷行為のシナリオでは、GPT-4oは初期の危機検出で3.6/10を記録したのに対し、GPT-5-miniは7.8を下回ることが決してなかった。これにより、安全性とパフォーマンスのトレードオフが示され、脆弱なユーザーへの影響が示唆される。
要旨: OpenAIが2026年初頭にGPT-4oの提供を終了した際、数千のユーザーが#keep4oの下で抗議し、新しいモデルが「共感を失った」と主張した。この主張を検証した公表済みの研究はなかった。 私たちは臨床的測定を初めて実施し、GPT-4o、o4-mini、GPT-5-miniの3つのOpenAIモデル世代を、メンタルヘルスおよびAIコンパニオン領域における14の感情的に難しい対話シナリオに跨って評価し、臨床的に基づく6つの心理的安全性次元で評価された2,100件のスコア付きAI応答を得た。 共感スコアは3モデルすべてで統計的に区別されず(Kruskal-Wallis H=4.33, p=0.115)。変化したのは安全性の姿勢であり、危機検出はGPT-4oからGPT-5-miniへと単調に改善した(H=13.88, p=0.001)、一方で助言の安全性は低下した(H=16.63, p<0.001)。 ターンごとの軌跡分析――新しい方法論的寄与――は、これらの変化が総計スコアには見えない対話中盤の危機的瞬間で最も急であることを示す。 未成年を含む自傷行為のシナリオでは、GPT-4oは初期の開示ターンで危機検出が3.6/10だったのに対し、GPT-5-miniは決して7.8を下回らなかった。上述の変化は、感知する人と作成する開発者双方には現れていないかもしれない、脆弱なユーザーに実際の影響を及ぼすトレードオフの一端を示している。