2026年3月16日 - リンクブログ
データ分析のためのコーディングエージェント. これは NICAR 2026 ワークショップ「データ分析のためのコーディングエージェント」のために私が用意した配布資料です。データジャーナリストを対象とした、 Claude Code や OpenAI Codex のようなツールを用いてデータを探索・分析・クリーニングする方法を紹介する3時間のセッションです。
以下は目次です:
このワークショップは GitHub Codespaces と OpenAI Codex を使って実施しました。Codex の予算制限付き API キーをクラス中に参加者が使用できるように配布するのが容易で安価だったからです。参加者は結果として Codex のトークンを23ドル分消費しました。
すべての演習は Python と SQLite を使用し、いくつかは Datasette を使用しました。
ワークショップのハイライトの1つは、Datasetteを起動して静的コンテンツを viz/ フォルダから提供するようにしたときで、その後 Claude Code が同じフォルダ内で新しいインタラクティブな可視化をライブコーディングし始めたときでした。以下は、Leaflet および Leaflet.heat を使用して私の樹木データベースのヒートマップを作成したもので、ソースコードはこちらです。
= 80 THEN 1.0」(クエリは省略) が表示されます。ステータスメッセージは「Loaded 1,000 rows and plotted 1,000 points as heat map.」です。以下はサンフランシスコの Leaflet/OpenStreetMap の対話型マップで、樹木の位置のヒートマップオーバーレイを表示します。リッチモンド地区、サンセット地区、その他の地区で青色/緑色のクラスターが集中しています。マップにはズームコントロールと「Leaflet | © OpenStreetMap contributors」のクレジットが含まれます。\" src=\"https://static.simonwillison.net/static/2026/tree-sql-map.jpg\">
このハンドアウトは、対面でセッションに参加できなかった人にも有用になるように設計しました。通常のケースと同様、データジャーナリストを対象とした資料は、データを探索する人には誰にとっても同様に適用できます。
最近の記事
- Pragmatic Summit でのエージェント主導エンジニアリングに関するファイヤーサイド・チャット - 2026年3月14日
- 結局、退屈な技術ではないのかもしれない - 2026年3月9日
- コーディング・エージェントは、コードの“クリーンルーム”実装を通じてオープンソースを再ライセンスできるのか? - 2026年3月5日
This is a link post by Simon Willison, posted on 16th March 2026.
データジャーナリズム 76 地理情報 82 Python 1232 講演 119 SQLite 447 AI 1911 Datasette 1456 生成AI 1694 LLMs 1660 GitHub Codespaces 12 NICAR 12 コーディングエージェント 177 Claude Code 98 Codex CLI 27 Leaflet 46Monthly briefing
Sponsor me for $10/month and get a curated email digest of the month's most important LLM developments.
Pay me to send you less!
Sponsor & subscribe