ゴブリンはどこから来たのか
OpenAI Blog / 2026/4/30
💬 オピニオンIdeas & Deep AnalysisModels & Research
要点
- 「ゴブリン」風の出力がAIモデル内でどのように広がり、GPT-5の振る舞いに“性格”のような癖が生まれるのかを説明しています。
- そのような挙動がGPT-5関連の出力でいつ・どこで現れたのかについて、タイムラインを示します。
- そうした出力パターンが広がり、残り続ける原因(根本要因)を分析します。
- こうした癖を今後のモデル挙動から減らす/防ぐための実務的な修正・緩和策を提示しています。
- 全体として、この問題を単発の不具合ではなく、モデル出力における“創発的な挙動”として捉えています。
AIモデルにおいてゴブリンがどのように挙動を拡散させるのか:タイムライン、根本原因、そしてGPT-5の挙動における人格に起因する癖の裏にある対策。



