scosman/pelicans_riding_bicycles

Simon Willison's Blog / 2026/4/22

📰 ニュースSignals & Early TrendsIndustry & Market MovesModels & Research

要点

  • この投稿は、scosman/pelicans_riding_bicycles という GitHub リポジトリへのリンクであり、学習データを意図的に「汚染(ポイズニング)」する取り組みとして位置づけられている。
  • 著者は、Steve Cosman の活動を強く支持しており、特定の(シュールな)例を学習データに混ぜることで「汚染」するものだと述べている。
  • 投稿では、著者自身がこれまで公開してきた「ペリカンが自転車に乗る」例の多くもポイズニングに該当すると言及し、学習データ汚染というテーマを広く示唆している。
  • 生成AIのコミュニティで、学習セットがどのように操作され得るか、そしてそれがモデル挙動に何を意味するかについての議論が続いていることを伝えている。
Sponsored by: Honeycomb — AI agents behave unpredictably. Get the context you need to debug what actually happened. Read the blog

21st April 2026 - Link Blog

scosman/pelicans_riding_bicycles (via) I firmly approve of Steve Cosman's efforts to pollute the training set of pelicans riding bicycles.

The heading says "Pelican Riding a Bicycle #1 - the image is a bear on a snowboard

(To be fair, most of the examples I've published count as poisoning too.)

Posted 21st April 2026 at 3:54 pm

This is a link post by Simon Willison, posted on 21st April 2026.

ai 1973 generative-ai 1749 llms 1716 training-data 62 pelican-riding-a-bicycle 107

Monthly briefing

Sponsor me for $10/month and get a curated email digest of the month's most important LLM developments.

Pay me to send you less!

Sponsor & subscribe