ChatGPT も Claude も Gemini も、ときどき事実でないことを、自信たっぷりの自然な文章で答えます。これは「ハルシネーション(幻覚)」と呼ばれ、AI の仕組み上ゼロにはできない性質です。読みやすい文章ほど鵜呑みにしがち。だからこそ、なぜ起こるのか・どこまで減ったのか・どう付き合うのかを、最初に整理しておきましょう。
01なぜ「もっともらしく間違える」のか
大規模言語モデルは「次に来そうな単語」を確率で選んで文章を組み立てます。だから学習データに無い情報でも、確率的に“ありそう”な並びがあれば、自然な文として出してしまう。これが古典的な説明です。
2025年9月にOpenAIが公開した論文「Why Language Models Hallucinate」は、ここに踏み込んだ理由を加えました。多くのハルシネーションは、特殊な故障ではなくふつうの「分類ミス」だというのです。さらに重要なのは、AIの賢さを測るテスト(ベンチマーク)の採点方法そのものが原因になっている、という指摘です。
FIG.1 「不明」に点を与えない採点では、推測(=ハッタリ)が得点上は最適になる
仕組みはこうです。多くのテストは答えを「正解か不正解か」だけで採点し、「分かりません(I don't know)」には点を与えません。すると、自信がなくても当てずっぽうで答えるほうが期待点が高くなる。学校のテストで、白紙より一か八か埋めたほうが得、というのと同じ構図です。この採点で鍛えると、モデルは「黙る」より「埋める」クセを身につけてしまう──これがOpenAIの主張です。2026年にはこの分析が学術誌 Nature にも採録され、ハルシネーションは「データの汚れ」だけでなく評価設計の問題でもある、という見方が広がりました。
02よくあるハルシネーションのパターン
「分からない」と言わずに埋めてくる──この性質が、具体的には次のような形で現れます。
存在しない情報源



