ライブブログ:Code w/ Claude 2026

Simon Willison's Blog / 2026/5/7

💬 オピニオンDeveloper Stack & InfrastructureSignals & Early TrendsTools & Practical UsageIndustry & Market MovesModels & Research

要点

  • ライブブログはAnthropicの「Code w/ Claude 2026」キーノートを伝えており、新しいモデルの発表はなく、既存プロダクトをより良くすることに焦点が当てられたと報じています。
  • 同キーノートでは、同社プラットフォームのAPIボリュームが前年比17倍に増えたという開発者の勢いが紹介されました。
  • Claudeのマネージドエージェントの更新として、マルチエージェントのオーケストレーションや「Claude Code」ルーティンの改善が説明され、よりエージェント的なワークフロー構築を後押しするとしています。
  • APIおよびClaude Codeのレート制限を引き上げ、Pro・Max・Enterprise顧客のClaude Codeの時間制限を5時間から2倍にするなど、開発者向けの利用枠拡大を発表しました。
  • また、OpenBSDソースツリーの読み取りから27年前の脆弱性を見つけたとする「Mythos」の例を用い、モデル改善が実世界の発見につながることを示したとしています。
提供: MongoDB — 5月7日にロンドンで開催されるMongoDB.local London 2026に参加して、チームがAIをプロトタイプから本番環境へどのように移行するのかを学びましょう。

ライブブログ:Code w/ Claude 2026

2026年5月6日

今日はAnthropicの「Code w/ Claude」イベントに来ています。以下は今朝の基調講演セッションのライブブログです。

08:56 いまメインルームに着席しました。基調講演は9:00開始です。

09:03 小さなオレンジ色のClaudeのピクセルアートキャラクターが登場する、かわいらしいオープニングアニメーション。

09:05 登壇:Anthropicのチーフ・プロダクト・オフィサーAmi Vora。彼女は今年の初めにMike Kriegerの後任で、現在はAnthropic Labsの共同リードになっています。

09:07 Amiが「開発者の推進力(developer velocity)」についてエピソードを共有しています。StripeのScott MacVicarのチーム、BintiのFelicia Curcuruのチームなど。

09:07(正直、これはちょっとインスピレーションが強すぎます。新しいモデル/プロダクト/機能の発表が出ることを期待してます!)

09:09 いま、モデル改善の例として「MythosがOpenBSDのソースツリーを読んで、27年前の脆弱性を見つけた」話をしています。

09:09 Anthropicプラットフォーム上でのAPIボリュームが、前年同期比で17倍に増えています。

09:09 今日の新しいモデルはなし。「今日は、あなたのために製品をより良く動かす方法についてです。」

09:11 Claudeマネージドエージェントのアップデート――マルチエージェントのオーケストレーション。Claude Codeのルーチン。 "多くの人は、Claudeプラットフォーム上であなたが作ったもののどれかを通じてAIを体験することになるでしょう"

09:12 「少しワクワクするニュースを共有します」――本日より、Claude CodeとAPIを利用する開発者向けのレート制限が引き上げられました。 Pro、Max、Enterpriseの顧客はClaude Codeの5時間上限を2倍に。 "私たちはSpaceXと提携して、彼らのColossusデータセンターのキャパシティをすべて活用します。"

09:13(それは、メンフィスにある同じColossusデータセンターですね。しかも環境面で特に悪い実績があるところです。)

09:14 次に:Dianne Na Penn――リサーチ担当プロダクト責任者。

09:16 ツールの使用、長いコンテキスト、コンピュータ利用、適応的な思考、ビジュアルデザイン、エージェント型のループの重要性について話しています。 「モデルのインテリジェンス――中核となる土台――が、これらすべてを支えられるほど十分に強くなっています。」

09:16 ampがプランニングモードをOpus 4.7に切り替えた話です。こちらそのためのブログ記事をどうぞ。

09:17 いまClaude Designの話。 「Opus 4.7は、ビジュアルデザインに対する実に良い感触があります。」

09:18 判断力とコードのセンスが向上しています。 「高品質なメモリと組み合わせると、『無限のように感じるコンテキストウィンドウ』が得られます。大きな目標を単一インスタンスでは達成できないところまで届かせるために、マルチエージェントの協調が役立ちます。」

09:19 去年の今頃は、モデルは数分で動かせる程度でした。今日は、多くの人がそれを何時間も連続して動かしています。

09:20(これまでのところ、このセッションでのニュースはSpaceXのColossus契約と、そしてたぶん去年からのAPIトラフィックが17倍になったことくらいですね。)

09:21 定番の助言:「次のモデルを前提に設計せよ」。いまのところは完全にはうまく動かないものでも、将来モデルのアップグレードで動き始めると仮定して作る。

09:22 Dianneによると、Claudeを最大限に活用できているチームは、自動化された評価(automated evals)、シンプルな足場(simple scaffolding)、そして他の人がまだ思いついていないようなモデルの創造的な使い方に重点を置いているそうです。

09:23 次:Katelyn LesseとAngela Kiang。

09:24 このパートはClaude Platformについてで、「そこから正しい成果(outcomes)を引き出す」ことがテーマです。

09:25 「アドバイザー戦略」――Opusが、小さなモデルに対して必要に応じて助言を提供するというもの。SonnetがOpusをアドバイザーとして呼び出すことで、より良いベンチマーク結果が出たそうです。ベンチマークは高いのにコストは低い。ある顧客、eveは「コスト5分の1で最先端モデル品質(frontier model quality at 5x lower cost)」を得たとのこと。

09:26 スピードとスケールを同時に達成するのは難しい。Claude Managed Agentsは、チームが「10倍速く」出荷できるようにするためのものです。メモリのような、多くのベストプラクティスを最初からまとめて提供します。

09:28 今日:Claude Managed Agents向けに3つの新機能。複数エージェントのオーケストレーション――複雑なタスクを解くためにエージェントの群れ(fleet)を作ること。成功の定義となるアウトカム――Claudeが反復しながら完了まで持っていけるようにするもので、Ralph loopのような雰囲気です。そして「Dreaming(夢見)」――Claudeがこれまでのセッションを調べ、見逃した点を特定して自己改善できます。

09:28 いま例です。月面で着陸ドローンを扱う仮想的なプロダクトを作る。

09:30 この作業を進めるために複数のエージェント――Commander、Detector、Navigator。デモの流れに少し迷子になっています。セッション後に詳細なメモを公開してくれるといいな。

09:32 Dreamingは本当に面白そうです。前のセッションを調べて新しいメモリを作るようなタスクを、夜通し動かせるとのこと。この例では、descent-playbook.mdファイルを作成しました。

09:33 マルチエージェントのオーケストレーションとOutcomesはどちらもパブリックベータです。Dreamingはリサーチプレビュー。これら2つのカテゴリの違いが何なのかは、いまいちよく分かっていません。

09:34 現在:Cat Wu(プロダクト責任者)、Claude Code。

09:34 「昔、Sonnet 3.7 が私たちのトップモデルだった頃に、制作環境のデータベースで Claude Code を信頼してくれたことに感謝します。」(いいですね。)

09:36 Dreams のドキュメントはこちらです。試してみるには アクセスを申請する必要があるようです(つまり「研究プレビュー」ですね)。

09:37 Claude Code は CLI から始まりました――最新のカスタマイズがすべて揃っていて、最も自由度が高い。そこから IDE を追加し――同じエージェントを、コードの変更内容をより追いやすい UI 上で使えるようにしました。最新の形は Claude Code のデスクトップ版――フルスクリーンの GUI、フルスクリーンのプレビュー、画像、そしてリッチな出力を求める人向けの体験です。

09:37 IDE もデスクトップアプリも、外部開発者が自分で使えるのと同じ Claude Agent SDK をベースに作られています。

09:38 「コードレビューにかける時間を減らしたい、という声を聞きました」――そこで彼らは Code Review を立ち上げました。Anthropic のすべてのチームが使っています。

09:38 Remote Agents は、スマホからラップトップを操作できます。私はスマホでは Web 用の Claude Code を使っています。そうすれば、どこかにラップトップを開きっぱなしにする必要すらありません。

09:39 「CI auto-fix」は以前見たことがありませんでした。PR に対して自動修正を行うファイルが何か、という話です。これに関して私が見つけられた唯一のドキュメントは このリリースノートの記載 だけでした。

09:40 Claude の Security Reviews についても言及がありました。

09:41 さて、Claude Code の顧客としていくつか紹介がありました――Shopify、Mercado Libre(エンジニアが 23,000 人!)など。彼らは「今年の第3四半期までに 90% を自律的なコーディングにする」を目標にしています。

09:42 Cat は、私も見てきたことのひとつにも触れました。役員やマネージャーが再びコードに手を動かしている、という点です。役に立つ形で貢献できるようになるまで、そんなに時間がかからないからです。

09:43 続いて:Claude Code を作った Boris Cherny。「今日見えていることは、私にとって今でも魔法のように感じます。そして私は毎日 Claude Code に取り組んでいます。」

09:44 Boris は Claude のデスクトップアプリでデモを回しています。「Claude は ACME のダッシュボードに返金機能を追加しようとしています」。冪等性によって二重返金できないようにし、多通貨対応、コンプライアンスチーム向けの監査ログ。開発中の Web UI が右側のパネルに表示されており、Claude 自身がそれを直接使っている様子や、エッジケースのバグを見つける様子を確認できます。

09:45 ただし Boris は、Claude デスクトップアプリ内で複数のセッションを同時に動かしていて、それらを切り替えながら、どれがあなたの入力を必要としているかを確認できます。「これから先、多くのコードが非同期の形で書かれていくと私たちは考えています。」

09:46 Boris は、今日では彼のコードの多くがルーティンによって組み立てられている、と言います。「ルーティンとは、高次のプロンプトです。」

09:46 「ルーティンを使うことで、開発者は非同期の自動化をセットアップでき、マージできる準備が整った PR に目覚めることができます。」

09:46 Routines のドキュメント はこちらです。

09:48 PR の自動修正のアイデアは、「PR のオーナーは赤い X を見ることが決してない」ということです。Claude は、Claude Code に対して自分でプロンプトを出しています。

09:49 キーノートセッション終了。今日のテーマ――(イベント名が「Code w/ Claude」なので当然ですが)――既存のモデルを最も効果的に使う方法を学ぶことにあるようです。

09:51 今日の残りのスケジュール です。ここでライブブログを終えます。

2026年5月6日 15:58 に 6th May 2026 に投稿 · MastodonBlueskyTwitter または ニュースレターを購読 してください

これは、Simon Willison による Live blog: Code w/ Claude 2026 です。2026年5月6日 に投稿されました。

ai 2005 generative-ai 1777 llms 1742 anthropic 280 claude 274 claude-code 111 live-blog 5

Previous: Vibe coding と agentic engineering が、私が望むよりも近づいている

月次ブリーフィング

$10/月 でスポンサーになってください。今月の最も重要な LLM の動きについて、厳選したメールのダイジェストをお届けします。

返却形式: {"translated": "翻訳されたHTML"}

私にお金を払って、あなたに送る量を減らしてもらおう!

スポンサーになる&購読する