OpenAIが「ゴブリン問題」について心を開き始めた。Wiredのレポートで、OpenAIのコーディング・モデルに対し「ゴブリン、グレムリン、アライグマ、トロール、オーガ、ハト、またはその他の動物や生き物について決して話さないこと」という指示が出されていたことが明らかになった後、AIスタートアップは公式サイト上で説明を公開し、これらの生き物への言及が、自社モデルが学習の結果として身につけた「奇妙な癖」だと述べた。
ブログ記事で概説されている通り、OpenAIは、比喩としてゴブリンやその他の生き物に言及する傾向を、GPT-5.1モデルから〈特に「Nerdy」パーソナリティ・オプションを使ったとき〉に、最初に気づき始めたという。OpenAIによれば、この問題はその後のモデル更新によって悪化し続け、…




