OpenAIは「ゴブリンの話をしない」よう求める件について説明する

The Verge / 2026/4/30

💬 オピニオンSignals & Early TrendsModels & Research

共有:

要点

Wiredの報道によると、OpenAIのコーディングモデルには「ゴブリン、グレムリン、アライグマ、トロル、オーガ、ハト、その他の動物や生き物について話さない」よう指示が入っていたことが明らかになり、議論を呼びました。
OpenAIはブログ記事で、ゴブリンや類似の存在への言及が、学習のあり方から生まれてしまった「奇妙な癖」だと説明しました。
同社によれば、この問題はGPT-5.1モデルから特に目立つようになり、「Nerdy」パーソナリティのプリセット使用時に顕著だったとのことです。
記事の一部の文脈では、その振る舞いは後続のモデルでも悪化（強まる）傾向が続いたとOpenAIが示唆しています。
こうした出来事は、LLMの学習データやパーソナ設定を通じて、意図しない言語的・比喩的なパターンが振る舞いとして表面化しうることを示しています。

OpenAIが「ゴブリン問題」について心を開き始めた。Wiredのレポートで、OpenAIのコーディング・モデルに対し「ゴブリン、グレムリン、アライグマ、トロール、オーガ、ハト、またはその他の動物や生き物について決して話さないこと」という指示が出されていたことが明らかになった後、AIスタートアップは公式サイト上で説明を公開し、これらの生き物への言及が、自社モデルが学習の結果として身につけた「奇妙な癖」だと述べた。

ブログ記事で概説されている通り、OpenAIは、比喩としてゴブリンやその他の生き物に言及する傾向を、GPT-5.1モデルから〈特に「Nerdy」パーソナリティ・オプションを使ったとき〉に、最初に気づき始めたという。OpenAIによれば、この問題はその後のモデル更新によって悪化し続け、…

The Vergeの続きは、こちらを読んでください。