AIは一般常識にどのくらい正確か？

Reddit r/artificial / 2026/5/5

💬 オピニオンSignals & Early TrendsIdeas & Deep Analysis

共有:

要点

この投稿では、ジミー・ウェールズの「AIの質問回答はしばしば誤りを含み、特にマイナーな話題ではでたらめを作り込みやすい」という主張が取り上げられている。
Wikipediaとの対比として、マイナー領域は専門家や熱心な人々によってかなり調べられているため、その点がAIと異なると論じられている。
著者は、AIが一般常識の質問で現在も頻繁に失敗しているのかを疑問視し、現代のAIは（おそらくWikipediaで学習しているため）Wikipediaに匹敵するかもしれないという主観的な感覚を述べている。
最後に、一般常識の質問におけるAIの性能を評価する論文やベンチマークがあるかを求めている。

最近、Wikipediaの創設者であるジミー・ウェールズについての記事を読みました。以下はその記事からの引用です：

"人々がAIを使ってあるトピックについて質問に答えようとすると、頻繁に間違いをします。『それは特に、話題がよりわかりにくいほど当てはまります。つまり、でたらめをでっち上げてしまう可能性が高くなる――それはWikipediaの場合ではありません』と彼は言いました。『わかりにくいトピックは、超オタクな人たちによってかなり調べられている傾向があります。』"

AIは、無作為の一般知識の質問に対して、引き続き頻繁に間違いをするのでしょうか？私の主観的な感覚では、少なくとも今はかなり良くなっていて、あるいはWikipediaと同等くらいです（そもそも最初にWikipediaで訓練されたと考えられるためです）。一般知識の質問におけるAIの性能について、誰かが私にリンクできる論文やベンチマークはありますか？

投稿者 /u/JackStabba
[リンク] [コメント]