AIは一般常識にどのくらい正確か?

Reddit r/artificial / 2026/5/5

💬 オピニオンSignals & Early TrendsIdeas & Deep Analysis

要点

  • この投稿では、ジミー・ウェールズの「AIの質問回答はしばしば誤りを含み、特にマイナーな話題ではでたらめを作り込みやすい」という主張が取り上げられている。
  • Wikipediaとの対比として、マイナー領域は専門家や熱心な人々によってかなり調べられているため、その点がAIと異なると論じられている。
  • 著者は、AIが一般常識の質問で現在も頻繁に失敗しているのかを疑問視し、現代のAIは(おそらくWikipediaで学習しているため)Wikipediaに匹敵するかもしれないという主観的な感覚を述べている。
  • 最後に、一般常識の質問におけるAIの性能を評価する論文やベンチマークがあるかを求めている。

最近、Wikipediaの創設者であるジミー・ウェールズについての記事を読みました。以下はその記事からの引用です:

"人々がAIを使ってあるトピックについて質問に答えようとすると、頻繁に間違いをします。『それは特に、話題がよりわかりにくいほど当てはまります。つまり、でたらめをでっち上げてしまう可能性が高くなる――それはWikipediaの場合ではありません』と彼は言いました。『わかりにくいトピックは、超オタクな人たちによってかなり調べられている傾向があります。』"

AIは、無作為の一般知識の質問に対して、引き続き頻繁に間違いをするのでしょうか?私の主観的な感覚では、少なくとも今はかなり良くなっていて、あるいはWikipediaと同等くらいです(そもそも最初にWikipediaで訓練されたと考えられるためです)。一般知識の質問におけるAIの性能について、誰かが私にリンクできる論文やベンチマークはありますか?

投稿者 /u/JackStabba
[リンク] [コメント]