AI Navigate

データ分析のためのコーディング・エージェント

Simon Willison's Blog / 2026/3/17

💬 オピニオンDeveloper Stack & InfrastructureIdeas & Deep AnalysisTools & Practical Usage

要点

  • NICAR 2026 のハンドアウトで、Claude Code と OpenAI Codex をデータジャーナリズムのためのデータを探索・分析・クレンジングするのにどのように活用できるかを示しています。
  • 目次は、ChatGPT と Claude でのウォームアップから、セットアップ、データベースの照会、データの探索、地区コードのクレンジング、可視化、エージェントを用いたデータのスクレイピングまでのワークフローを概説しています。
  • ワークショップは GitHub Codespaces で Codex を使用して実施され、参加者が Codex トークンに約23ドルを費やしたという予算に優しいアプローチを示しています。
  • 演習は全体を通して Python と SQLite を使用しており、一部のセッションでは Datasette をデータの提供に活用しています。
  • ハイライトとして、Claude Code が viz/ フォルダ内で新しいインタラクティブな可視化を生成し、Leaflet.heat を用いて樹木データベースのヒートマップを作成する様子を示しました。
Sponsored by: CodeRabbit — Planner は 再作業とAIノイズを最小化しつつ、コーディングエージェントを10倍にします。 今すぐ試す

2026年3月16日 - リンクブログ

データ分析のためのコーディングエージェント. これは NICAR 2026 ワークショップ「データ分析のためのコーディングエージェント」のために私が用意した配布資料です。データジャーナリストを対象とした、 Claude Code や OpenAI Codex のようなツールを用いてデータを探索・分析・クリーニングする方法を紹介する3時間のセッションです。

以下は目次です:

このワークショップは GitHub Codespaces と OpenAI Codex を使って実施しました。Codex の予算制限付き API キーをクラス中に参加者が使用できるように配布するのが容易で安価だったからです。参加者は結果として Codex のトークンを23ドル分消費しました。

すべての演習は Python と SQLite を使用し、いくつかは Datasette を使用しました。

ワークショップのハイライトの1つは、Datasetteを起動して静的コンテンツを viz/ フォルダから提供するようにしたときで、その後 Claude Code が同じフォルダ内で新しいインタラクティブな可視化をライブコーディングし始めたときでした。以下は、Leaflet および Leaflet.heat を使用して私の樹木データベースのヒートマップを作成したもので、ソースコードはこちらです。

= 80 THEN 1.0」(クエリは省略) が表示されます。ステータスメッセージは「Loaded 1,000 rows and plotted 1,000 points as heat map.」です。以下はサンフランシスコの Leaflet/OpenStreetMap の対話型マップで、樹木の位置のヒートマップオーバーレイを表示します。リッチモンド地区、サンセット地区、その他の地区で青色/緑色のクラスターが集中しています。マップにはズームコントロールと「Leaflet | © OpenStreetMap contributors」のクレジットが含まれます。\" src=\"https://static.simonwillison.net/static/2026/tree-sql-map.jpg\">

このハンドアウトは、対面でセッションに参加できなかった人にも有用になるように設計しました。通常のケースと同様、データジャーナリストを対象とした資料は、データを探索する人には誰にとっても同様に適用できます。

投稿:2026年3月16日 午後8:12