ゴブリンはどこから来たのか

OpenAI Blog / 2026/4/30

💬 オピニオンIdeas & Deep AnalysisModels & Research

要点

  • 「ゴブリン」風の出力がAIモデル内でどのように広がり、GPT-5の振る舞いに“性格”のような癖が生まれるのかを説明しています。
  • そのような挙動がGPT-5関連の出力でいつ・どこで現れたのかについて、タイムラインを示します。
  • そうした出力パターンが広がり、残り続ける原因(根本要因)を分析します。
  • こうした癖を今後のモデル挙動から減らす/防ぐための実務的な修正・緩和策を提示しています。
  • 全体として、この問題を単発の不具合ではなく、モデル出力における“創発的な挙動”として捉えています。
AIモデルにおいてゴブリンがどのように挙動を拡散させるのか:タイムライン、根本原因、そしてGPT-5の挙動における人格に起因する癖の裏にある対策。