「なぜあなたはそうなの?」

Simon Willison's Blog / 2026/4/26

💬 オピニオンSignals & Early TrendsModels & Research

要点

  • この投稿では「ペリカンが自転車に乗る」ベンチマークと、それに対する反応が取り上げられ、テストを重ねるための自動化されたテスト群を追加すべきだという考えが示されます。
  • ChatGPT Images 2.0 がプロンプトに明示されていないにもかかわらず、「WHY ARE YOU LIKE THIS」という標識を自発的に生成したことが確認されています。
  • 例として、非常に混沌とした一連の状況(馬→宇宙飛行士→ペリカン→自転車)が指定されていますが、それでもモデルが追加の視覚要素を独自に入れてきます。
  • 全体として、生成画像モデルが追加のディテールを勝手に挿入しうることが示され、信頼性の高いベンチマークと回帰テストの重要性が強調されています。
提供: Sonar — SAST + SCA を今すぐ利用できるようになり、セキュアで、依存関係を理解したアジェンティック・エンジニアリングのために。 SonarQube Advanced Security

2026年4月25日

@scottjla (Twitterで) は、私の ペリカンが自転車に乗る ベンチマークへの返信として:

今こそ、これらのテストを積み上げる必要がある気がする

AI生成画像。ペリカンが土の小道を自転車に乗って走り、警察の車に追われている。ペリカンはパニックしているように見える。理由は、おそらく宇宙飛行士(なぜか把持できるつま先を持つ)が、耳であるはずの位置にしがみついて、そのペリカンに乗っているからだ。宇宙飛行士は馬に乗せられており、同じく非常に荒れた表情をしている。ピザの一切れと缶とカウボーイハットが、彼らの横で落ちている。背景の道路標識には『なぜ君はそうなの?』と書かれている。

モデル(ChatGPT Images 2.0)が自らの判断で『なぜ君はそうなの?』の標識を追加したことを確認しました。そして 実際にそうでした。スコットが使ったプロンプトは次のとおりです:

馬に乗った宇宙飛行士の画像を作成してください。宇宙飛行士は自転車に乗っているペリカンに乗っています。とてもめちゃくちゃに見えますが、彼らは全員、互いの上に乗った状態でもなんとかバランスを保っています

2026年4月25日 午後4時44分に投稿

これは Simon Willison によるメモで、2026年4月25日に投稿されました。

ai 1985 generative-ai 1761 chatgpt 196 slop 38 text-to-image 42 pelican-riding-a-bicycle 111

月間ブリーフィング

月10ドルで私をスポンサーして、今月の最重要な LLM の動向を厳選したメール・ダイジェストを受け取ってください。

私に払って、あなたに送る量を減らしてもらいましょう!

スポンサー & 購読する