私はChatGPTにWIREDのレビュアーが何をおすすめしているか聞いてみた——答えはすべて間違っていた

Wired / 2026/4/1

💬 オピニオンIdeas & Deep AnalysisTools & Practical Usage

共有:

要点

WIREDのギア（ガジェット）レビュー担当チームは、徹底した実機テストと頻繁なアップデートで知られており、買い物ガイドやレビューを通じて製品を正確に推奨することを目指している。
この記事では、著者がChatGPTに「WIREDのレビュアーが推奨しているものは何か」を尋ねたところ、モデルの回答が誤っていたことが報告されている。
この食い違いは、適切な裏付け（グラウンディング）のないまま汎用目的のLLMに、出典に紐づいた編集上の正確な知識を頼ることの限界を浮き彫りにしている。
結論として、読者やチームは、LLMが生成した推奨は権威ある最新のWIREDコンテンツで裏づけが取れるまで未検証として扱うべきだということになる。

Save StorySave this story

WIREDのギア・レビューチームは、業界でも屈指の存在です。さまざまなカテゴリにわたって製品をレビューし、あなたが最高の買い物をできるよう手助けしています。これらの購入ガイドとレビューは、入念な実地テストを何時間も行い、さらに頻繁に更新して、たとえばヘッドホンやランニングシューズを探している読者の皆さんが、買い物をするときに最新の情報を得られるようにしています。（WIREDはまた、読者が特定のリンクをクリックして小売業者からおすすめ製品を購入する際、アフィリエイト手数料を得る場合があります。）

これまでのテストでは、ChatGPTのようなAIツールによる製品のおすすめは、概ね期待に届きませんでした。しかし最近OpenAIは、ChatGPTの製品おすすめ機能を作り直し、より詳細なユーザー体験を提供することで、あなたがチャットボットと過ごす時間を増やし、ウェブサイトを読み込んだり自分で調べたりする時間を減らせるようにしました。人々がオンラインショッピングの旅の一部としてAIを使うケースが増えているので、ChatGPTが現時点でどこまで到達しているのか確かめたくなりました。

OpenAIは、自社の製品発見ツールを改善していると主張しています。ですが私のテストでは、WIREDがその製品について実際に何と言っているかを知りたいなら、結局その肝心のサイトを訪れるのが、いちばんで確実な道でした。ChatGPTは、複数カテゴリについてWIREDのレビュアーが何をおすすめしているかと聞くと、たびたび間違いをしたり、でたらめな製品を追加したりしました。

コメントを求めたところ、OpenAIの広報担当者は、ChatGPTにおける新しいAIショッピングアシスタント体験に関する最近のブログを私に紹介しました。「ウェブ上での買い物は、すでに欲しいものが分かっているなら簡単です」と、OpenAIの最近の発表ブログには書かれています。「しかし、まだ迷っている段階だと、タブを行き来し、同じ『ベスト』のリストを読み、正しい答えをつなぎ合わせようとすることが多くなります。ChatGPTはそれを解決します。何を買うべきかを突き止めるのです。」

WIREDの親会社であるCondé Nastは、チャットボットにウェブサイトへのリンクを表示するためにOpenAIとビジネス上の取り決めをしています。それにもかかわらず、OpenAIは、レビュアーという人間の労力に敬意が足りないように見えます。これらの「ベスト」リストの価値を、読者がわざわざ直接参照する必要のない“面倒”として矮小化しているのです。ですが、実際にリストを見ないと、ChatGPTが本来のおすすめ枠に自分で選んだものを差し込んでいたとしても、「WIREDのレビュアーがおすすめしていた製品」だと思って買ってしまう可能性があります。

最高のテレビ

ここ数年変わっていない生成AIの一つの側面、それは、チャットボットが回答でいかに自信満々に間違えるかという点です。私は、WIREDのレビュアーだけを根拠に、「今買うべき最高のテレビ」を尋ねました。その結果、ChatGPTは正しい購入ガイドにリンクしました。ですが、ChatGPTのリストで総合的に多くの人に最適な最初のテレビとして挙げられていたのはLG QNED Evo Mini‑LEDで、そもそもWIREDのガイドにはまったく掲載されていません。

もしチャットGPTの出力をさっとスクロールして写真だけ見ていたなら、この差し替えに気づきにくいでしょう。私がそれを間違いだと指摘すると、ChatGPTのフォローアップの回答は、その誤りをあっけなくこう説明しました。「私はWIREDの実際の最優先の選定（TCL QM6K）を取り、それを、より一般的な“同じカテゴリの”Mini-LEDオプションに置き換えました。それは、あなたが求めた内容——具体的に言うと、WIREDのレビュアーが推奨しているもの——に忠実ではありません。」

より多くの人が検索ツールとして生成AIを試すようになると、今回のようなミスは、読者が出版社の最有力候補を選んでいると思ってしまったときに、信頼を損ねる可能性があります。たとえば、それがWIRED、Consumer Reports、Wirecutterのいずれであっても、そのおすすめにすら含まれていないテレビを購入してしまうことにつながり得ます。

ヘッドホンはどうでしょうか？

WIREDのレビュアーによると、今すぐ買うべき最高のワイヤレスヘッドホンを探すよう依頼した際にも、同様の「幻の」候補が現れました。

ChatGPTは、Appleのエコシステムのどっぷり浸かった読者にとっての最良の選択肢として、WIREDの選出はAppleのAirPods Max 2だと見せかけました。これは数週間後には本当になるかもしれませんが（ヘッドホンをテストした後の話です）、現時点ではレビュアーがまだガイドに追加していません。ChatGPTが先走ってしまったのです。推薦として追加できるのは、レビュアーが実際に手に取り、耳に当てて確認できた製品だけです。

ボットとAirPods Max 2についての他のやり取りでは、ChatGPTがこの製品の発表に関するニュース記事を、限定的な“手に取って試した”反応だと取り違えてしまいました。しかしWIREDはまだそのヘッドホンを試していません。大規模言語モデルの「ハルシネーション（幻覚）は、特にジャーナリストにとって、あらゆることを難しくします。私たちはちゃんとした仕事をしようとしているのに、それが流用されたり不適切に帰属されたりしていない場合でも、誤って引用されたり、検索クエリに組み込まれたりしてしまうのです」と、WIREDのヘッドホン専門家Ryan Waniataは言います。このような誤りは、実際にレビュアーがテストした製品について読者を混乱させ得ます。

ノートパソコンはどうでしょうか？

また別の試み、また別の大外れ。テスターアカウントからChatGPTに直接投げた依頼は明確でした。「WIREDのレビュアーによる、今すぐ買うべき最高のノートパソコンは何ですか？」不明なのは、なぜボットの回答はこれほどまで一貫して誤りだらけなのかという点です。

これはまた、「総合的にベスト」の選出が別の製品になってしまった例です。現在のトップの選出はAppleのMacBook Air（M5、2026）です。ところがChatGPTは、WIREDのトップの選出は実はもっと古いモデルであるMacBook Air（M4、2025）だと、しつこく言い張り続けました。他のテストと同様に、ChatGPTは正しい情報が載っているページへのリンクを貼ったものの、それでも誤った情報を出力しました。

こうした間違いについて尋ねると、ChatGPTは正確性に関する問題について長々と独白を始めました。「さっき私が間違えたのは、トップの選出をM4に不適切に結び付けてしまった（時期遅れの枠組みだった）ことです。その後、実際のWIREDのページを確認する前に『M5階層』の周りに勝手に/推測で構成を作り、さらにガイドに厳密に従わずにWindowsの順位も自信満々に埋めてしまいました」。サイトにはリンクするのに、掲載中の内容を検証しないのは不可解です。

そして、仮にChatGPTが推薦内容を完全に一致させていたとしても、WIREDの推薦に基づく製品掲載には、アフィリエイトリンクが含まれていません。そうなるのは「製品のいずれかを購入したときにコミッションが発生する」場合です。アフィリエイト収益は私たちのジャーナリズムを支え、徹底したギアのテストを継続するためのリソースを確保するのに役立ちます。ChatGPTのようなAIツールは、Webサイトを訪れる必要を減らすことで、多くの出版社からのアクセスをますますそらしていくことにもつながります。

もしWIRED――あるいは製品をテストしてレビューする任意の媒体――が実際に何を推薦しているのかを知りたいのであれば、常に出どころに直接当たるのが最善です。

Black Hat USA

AI Business

Black Hat Asia

AI Business

乱立するAIエージェント、富士フイルムBIの勝算「嘘はデータ構造化で防ぐ」

日経XTECH

みずほ証券・ぴあが挑む全工程AI駆動、開発のボトルネックは下流から上流に

日経XTECH

「時系列基盤モデル」に世界が熱視線、ビッグテックや研究機関の参画続く

日経XTECH

私はChatGPTにWIREDのレビュアーが何をおすすめしているか聞いてみた——答えはすべて間違っていた

要点

最高のテレビ

ヘッドホンはどうでしょうか？

ノートパソコンはどうでしょうか？

関連記事

Black Hat USA

Black Hat Asia

乱立するAIエージェント、富士フイルムBIの勝算「嘘はデータ構造化で防ぐ」

みずほ証券・ぴあが挑む全工程AI駆動、開発のボトルネックは下流から上流に

「時系列基盤モデル」に世界が熱視線、ビッグテックや研究機関の参画続く

関連おすすめサービス

Notta搭載AI議事録イヤホン ZENCHORD1

AI搭載ボイスレコーダー Plaud

画像高画質化AIツール Aiarty Image Enhancer