レニーのポッドキャストで語った「エージェンティック・エンジニアリング」についてのハイライト

Simon Willison's Blog / 2026/4/3

💬 オピニオンSignals & Early TrendsIdeas & Deep Analysis

要点

  • この投稿は、レニー・ラキツキーのポッドキャスト回「An AI state of the union」でのサイモン・ウィリスンの出演をまとめ、AI主導のソフトウェア開発における大きな変化点を強調しています。
  • 「エージェンティック・エンジニアリング」というテーマに焦点を当て、典型的なソフトウェアのワークフローがどのように変わりつつあるのか、そしてエンジニアの役割が他の知識労働者に対する早期の指標になり得るという点を示します。
  • ウィリスンは、電話でコードを書くこと、「responsible vibe coding(責任あるノリのコーディング)」といった実践的・体験的な話題や、開発実務へのより広い示唆について語ります。
  • ハイライトでは、運用上のボトルネックがテスト側へ移っていき、よりコストのかからない中断になる一方で、ソフトウェアのタイムラインや工数の見積もりが信頼できなくなっている点も指摘しています。
  • 会話ではさらに、大規模なオートメーション—「dark factories(暗黒の工場)」への言及を含む—にも触れ、特に中位層の人々を中心に、経験レベルを問わず人々にどのような影響が及ぶのかを論じています。
スポンサー: WorkOS — エンタープライズ顧客に販売する準備はできていますか?WorkOSで、安全に構築し、提供まで行いましょう。

LennyのPodcastで「エージェント的エンジニアリング」について話した内容のハイライト

2026年4月2日

私はLenny Rachitskyのポッドキャストにゲスト出演しました。新しいエピソードのタイトルはAn AI state of the union: We’ve passed the inflection point, dark factories are coming, and automation timelinesです。YouTubeSpotify、およびApple Podcastsで聴けます。以下は、会話のハイライトと関連リンクです。

11月の転換点

4:19—この2つのラボが、モデルをコードでより良くするために持てるものをすべて投入して行った結果として、11月には、私が転換点と呼ぶものが訪れました。GPT 5.1とClaude Opus 4.5が登場したのです。

どちらも、以前のモデルより段階的に良くはなっていたのですが、というよりも、これまでならコードは概ね動くものの、きちんと注意深く見ていないといけないような「閾値」を越える形で良くなりました。すると、そこから……ほとんどの場合、指示したとおりに動くようになり、これが世界の見え方を変えるほど決定的でした。

いまでは、コーディングエージェントを立ち上げて、この作業をしてくれるMacアプリを作ってと言えるようになっています。そして返ってくるものは、何もできないバグだらけのゴミの山みたいなものではありません。

他の知的労働者にとっての先行指標としてのソフトウェアエンジニア

5:49—私は1日で10,000行のコードを吐き出せます。そしてその多くは動きます。これって良いことなんでしょうか?「ほとんど動く」から「全部が動く」へはどうやって到達するのか?私たちが直面している新しい問いが山ほどあります。だからこそ、私たちは他の情報労働者にとっての先行指標になると思っています。

コードは、あなたがこれらのエージェントに投げるほぼすべての他の課題よりも扱いやすいです。なぜならコードは、明らかに正しいか間違っているかだからです。つまり動くか、動かないか。細かな見えないバグがいくつかあるかもしれませんが、基本的には、本当に動くかどうかは判断できます。

もしエッセイを書かせるなら、もし訴訟の書類を用意させるなら、それが本当に良い仕事をしたかどうかを導き出すのは、ずっと難しい。さらに、正しくやれているのか、間違っているのかを見抜くのも難しい。でもそれが、私たちソフトウェアエンジニアに今まさに起きています。最初に来たのが私たちでした。

そして私たちは考えています。よし、私たちのキャリアはどうなるのか?以前は、私たちがしていた仕事のうち大半の時間を占めていたものの一部が、もはや大半の時間を占めなくなったとしたら、チームとしてどう働くのか?それはどんなふうになるのか?そして、この流れが今後、他の情報労働にもどう展開していくのかを見るのは、とても興味深いはずです。

弁護士たちはこれにひどく引っかかっています。AIハルシネーションの事例データベースは、いまや1,228件まで増えています!

さらに、開始時のコールドオープンからのこの一節:

以前は、ChatGPTにコードを頼むと、コードを吐き出してくれて、それを実行してテストしないといけなかった。でもコーディングエージェントは、そのステップを今はあなたの代わりにやってくれます。そこで僕が考えるのは、こうしたエージェントのループに実際に引きずられやすい、他の知識労働分野がどれくらいあるのか、という点です。

スマホでコードを書く

8:19—私はスマホで自分のコードのかなりの量を書いています。これ、すごいことです。海辺を散歩しながら犬の散歩をしているときに、気持ちよく良い仕事ができちゃうんです。

主にこの用途で使っているのはClaudeのiPhoneアプリです。通常のClaudeチャットセッション(これなら今コードを実行できます)として使うこともあれば、Claude Code for webを操作するために使うこともあります。

責任あるバイブ・コーディング

9:55 もし自分のために何かを「バイブ・コーディング」していて、バグがあっても傷つくのが自分だけなら、存分にやっていい。完全にそれで構いません。バイブ・コーディングで作ったコードを他の人が使うために公開してしまった瞬間に、あなたのバグが実際に誰かに危害を与え得る──そのときに、一歩引いて考える必要が出てきます。

こちらも参照 バイブ・コーディングをしていいのはいつ?

ダークファクトリーとStrongDM

12:49 「ダークファクトリー」と呼ばれる理由は、工場の自動化におけるこの発想があるからです。つまり、工場があまりにも自動化されていて、そこに人がまったく必要ないなら、照明を消せる、という考え方ですね。人が工場のフロアにいなくても、機械が完全な暗闇の中で動ける、というようなことです。ではソフトウェアでは、それはどういうことになるのでしょう?[...]

そこで、この方針がある。「誰もコードを書かない」つまり、コンピュータにコードを打ち込んではいけない。正直、6か月前の私は、それはあり得ないほどおかしいと思っていました。そして今、たぶん私が生成しているコードの95%は、自分ではタイピングしていません。その世界はすでに実用的です。最新のモデルは十分に賢くて、「この変数名をリネームして、リファクタして、この行を追加して」と指示すれば、それをそのままやってくれる。キーボードを自分で叩いて打ち込むよりも速いからです。

ただ次のルールは、「誰もコードを読む」ということです。そしてStrongDMが去年からやり始めたのはまさにここです。

また、2月にStrongDMのダークファクトリーに関する探求について、さらに詳しく書きました。

ボトルネックはテスト側に移った

21:27—以前は、仕様を考えて、それをエンジニアリングチームに渡す。で、3週間後、運が良ければ、彼らが実装を持って戻ってくる。でも今は、コーディング・エージェントがそういう用途でどれくらい整備されているか次第ですが、たぶんそれでも3時間くらいはかかる。じゃあ次は何でしょう? 今度は、ボトルネックはどこにあるのか。

プロダクト作りを少しでもやったことがある人なら知っていますが、最初のアイデアはいつだって間違っています。重要なのは、それらを検証していくこと、そしてテストすることです。

いまは、ずいぶん速くテストできるようになりました。動くプロトタイプをこれまでよりずっと素早く作れるからです。だから私が自分の仕事でやっている面白いことがあります。自分が設計したい機能があると、しばしば「動く可能性のあるやり方」を3通りほど試作します。そうすれば、ほとんど時間がかからないからです。

私はずっと試作が大好きでした。そして、試作は今ますます価値が高くなっています。

22:40—UIのプロトタイプは今や無料同然です。ChatGPTやClaudeが、あなたの説明した内容に基づいて、かなり説得力のあるUIをその場で作ってくれます。それが、あなたが取るべき働き方だと思います。プロダクトデザインをしているのに、ちょっとしたプロトタイプをバイブ・コーディングしていない人は、この工程で得られる最も強力なブーストを取り逃がしていると思います。

でも、その次にどうする? 1つではなく3つの選択肢がある状況で、そのうちどれが一番いいのかを自分自身でどうやって証明するのか。私はそれについて自信のある答えはありません。たぶん、ここにこそ昔ながらのユーザビリティ・テストが入ってくるのでしょう。

プロトタイピングについては後で詳しく:

46:35—私のキャリア全体を通じて、私のスーパーパワーはプロトタイピングでした。私は、物事の動くプロトタイプを素早く作るのがとても得意でした。会議に行って、こういうふうにすれば動くというのを見せられる人間でした。それが、私の独自の売り込みポイントでもあったんです。でもそれはなくなりました。誰でも、私ができたことと同じことができるようになっている。

こういうのは消耗する

26:25—コーディング・エージェントをうまく使うことは、ソフトウェアエンジニアとして25年積み上げた経験のあらゆる細部を総動員する必要があり、精神的にとても消耗します。4つのエージェントを並列に起動して、それぞれを別々の問題に取り組ませることはできます。そして、たとえば午前11時くらいには、もうその日の自分はすり減り切ってしまっている。[...]

新しい限界を見つけるうえで学ばなければならないのは、責任あるやり方で──燃え尽きないために、どこまでやっていいかという個人的なスキルです。

私は多くの人と話しましたが、彼らは寝られなくなっています。理由は「コーディング・エージェントが自分の代わりに仕事できるのに、私はまだ起きてないといけないんだ。だからあと30分起きて、追加のことをいくつも投げておこう」みたいな感じで、そして朝4時に起きてしまう。もちろん、それは持続不可能です。[...]

こうしたツールを使い方によっては、ギャンブル性や依存性の要素があるんです。

中断のコストは今かなり低い

45:16—「コーダーを中断しないことが重要だ」という話をよく聞きます。コーダーには、しっかり2〜4時間の中断のない作業ブロックが必要で、そうしてようやく頭の中のモデルを立ち上げてコードをどんどん出せる、というわけですね。でもそれは完全に変わりました。私のプログラミング作業は、時々、エージェントに「次に何をやるか」を促すために2分ほど必要なだけです。あとは他の用事をして、戻ってこれます。私は以前よりずっと中断されても大丈夫になっています。

ソフトウェア見積り能力が壊れている

28:19—私は、何かを作るのにどれくらい時間がかかるかという点で25年の経験があります。でもそれはすべて完全に消えました。もう機能しないんです。というのも、問題を見て「これは2週間かかるから、やる価値がない」と言えてしまうからです。ところが今は「2週間なんて要らないかも。20分くらいかも」となってしまう。2週間かかっていた原因は、これまでのような面倒で泥臭いコーディング作業が、AIによって今は私たちの代わりにカバーされてしまうからです。

私は、AIに対して、できないと思うタスクを絶えず投げています。ときどき本当にできてしまうからです。できないときは学びがありますよね? でも、AIができてしまうとき、特に以前のモデルができなかったようなことまでできるとしたら、それは実際に最先端のAI研究です。

そして関連するエピソード:

36:56—私の友人の多くが、サイドプロジェクトのバックログを抱えているという話をしていましたよね。ここ10〜15年で、なかなか完了しないプロジェクトがいくつかある。で、その中には「全部もう終わらせたよ」っていう人もいる。ここ数か月で、毎晩そのプロジェクトを手に取って「よし、これを終わらせよう」と片っ端から進めたらしい。そして最後には、ちょっとした喪失感みたいなものを感じているように聞こえます。「えっ、よし、バックログがなくなっちゃった。じゃあ次に何を作るんだ?」って。

中間層の人たちにはつらい

29:29—大手ITコンサルのThoughtWorksが、約1か月前にオフサイトを開催したんですが、そこでさまざまな会社から工学系のVP(シニア幹部)を集めて、この手の話を議論したんです。そこで出てきた面白い仮説の1つは、こうした取り組みは経験豊富なエンジニアにとても良い、つまりスキルを増幅するからだという考えです。新しいエンジニアにもかなり良い。オンボーディングの課題をたくさん解決してくれるからです。問題は「中間層」の人たちです。あなたがキャリアの途中で、まだ“超”シニアエンジニアに到達していない一方で、まったく新米でもない。その層が、たぶん今いちばん困っているグループです。

私はCloudflareが1,000人のインターンを採用する件に触れました。それにShopifyも。

レニーは、その「ちょうど真ん中で立ち往生している」人たちに対する僕の助言を求めました。

31:21—「そこであなたにそんな大きな責任を負わせることになるとは!」って思うけど、前に進む道はこれらのものに乗り込んで、どうすれば役立てて自分をもっと良くできるかを考えることだと思うんです。

多くの人がスキルの萎縮(skill atrophy)を心配します。AIがあなたの代わりにやってくれるなら、あなたは何も学んでいないのではないか、と。もしそれが心配なら、その心配に従って抵抗すべきだと思います。技術をどう適用しているかに注意して、「どんな質問にも答えてくれて、しかも多くの場合正解を出してくれるこのものが与えられた。じゃあ自分のスキルを増幅するにはどう使えばいい?新しいことを学ぶには?もっと野心的なプロジェクトに取り組むには?」と考える必要があります。[...]

33:05—今は物事がものすごい速さで変わっています。普遍的なスキルは、変化に合わせて転がしていけることだけです。それが、私たち全員に必要なことです。

AIとどう付き合えば「すごく良くなれる」のかという会話で、いちばんよく出てくるのはエージェンシー(agency)という言葉です。ですが、僕はエージェンシーを持っているエージェントなど存在しないと思っています。AIに「エージェンシー」だけは絶対に持てない、と主張したい。AIには人間の動機がないからです。

だから言いたいのは、自分自身のエージェンシーに投資して、この技術をどう使えば自分がやっていることをより良くできるか、そして新しいことに取り組めるかに投資するべきだ、ということです。

ソフトウェアを評価しにくい

詳細なドキュメントと堅牢なテストを添えてソフトウェアを作ることがとても簡単になったという事実によって、「信頼できるプロジェクト」が何なのかを見極めるのが難しくなっています。

37:47 たとえば、あるソフトウェアの部品、Pythonライブラリなどのアイデアを思いついて、だいたい1時間くらいで作業を片づけてしまい、ドキュメントやテストも揃った状態まで持っていけることがあります。そうすると、以前なら数週間かけて作ったであろう種類のソフトウェアに見えるし、GitHubにそのまま上げられてしまう。

でも...僕はそれを信じていません。信じていない理由は、そうした作業を全部急いで通り抜けたからです。品質はおそらく良いのだろうけど、その品質について確信を持てるほど十分な時間を使っていません。なにより、まだ使っていない

他人のソフトウェアを使うときに、僕がいちばん気にするのは「それを何か月も使い続けているかどうか」なんです。

僕は、作ったのに一度も使ったことがないかなりクールなソフトウェアをいくつか持っています。実際に使ってみようとするより、それを作る方がずっと早かったんです!

AIツールは簡単だという誤解

41:31—「ああ、きっと簡単なんだろうな。チャットボットなんだし」ってみんな言うんです。でも簡単じゃない。AIにおける偉大な誤解のひとつが、「これらのツールを効果的に使うのは簡単だ」という点です。効果的に使うには練習がたくさん必要で、うまくいかなかったことを試してみて、うまくいったことも試してみる必要があります。

コーディングエージェントは今、セキュリティリサーチに役立つ

19:04—ここ3〜6か月ほどの間に、彼らはセキュリティリサーチャーとして信頼できる存在になり始めました。それがセキュリティリサーチ業界に衝撃波を広げています。

Thomas Ptacekを見てください:Vulnerability Research Is Cooked

同時に、オープンソースのプロジェクトには大量の「ガラクタ」セキュリティレポートが投げ込まれています:

20:05—やってることが分かってない人たちがいて、ChatGPTにセキュリティホールを探させて、それをメンテナーに報告してくるんです。しかもレポートは見栄えがいい。ChatGPTは、脆弱性についてとてもよく整ったレポートを作れます。でも、それは完全に時間の無駄です。実際に本当の問題として検証されているわけではありません。

正しいやり方の良い例はFirefoxとのAnthropicの協業です。そこでは、AnthropicのセキュリティチームがMozillaに渡す前に、あらゆるセキュリティ問題を検証しています。

OpenClaw

もちろんOpenClawの話はしないわけにいきません!レニーはMac Miniで動かしていました。

1:29:23—OpenClawは、人々がパーソナルなデジタルアシスタントをこれほどまでに欲しがっていることを示しています。人々はセキュリティ面を見落とすことさえ厭わないし、さらに言えば、動かしてセットアップするのが簡単ではないにもかかわらず、それでもやってみようとする。APIキーやトークンを作って、インストールして……といった手間が必要で、セットアップするのは些細なことではありません。それでも数十万人がセットアップできたわけです。[...]

OpenClawの最初のコードは11月25日に書かれました。そしてスーパーボウルでは、AI.comの広告がありました。実質的には、OpenClawを“中身は同じだけどブランドだけ別”としてホスティングするバグりのない(vaporware)提供者のようなものです。つまり、11月の最初のコードからスーパーボウルの広告まで、たった3か月半で到達したわけです。

僕は、OpenClawをデジタルペットのようだと語るDrew Breunigの説明を、引き続きとても気に入っています:

「友人が言うには、OpenClawは基本的にタマゴッチだそうです。デジタルペットで、Mac Miniを水槽として買うんです。」

ジャーナリストは信頼できない情報源への対処がうまい

僕がDatasetteを通じてデータジャーナリズムのためのAIを探っていた話をする中で:

1:34:58—AIは真実を見つけるのが目的のジャーナリズムとは相性が悪いはずだ、と思うかもしれません。でも裏返すと、ジャーナリストは、信頼できない情報源といつも付き合っているんです。ジャーナリズムの技術というのは、たくさんの人に話を聞いて、そのうちの何人かがウソをついてくることを前提にしつつ、何が本当なのかを見抜くことです。だから、ジャーナリストがAIを、単なるもう一つの信頼できない情報源として扱う限り、AIと協働する能力は、たいていの他の職業の人よりもむしろ高い状態になっている、ということになります。

ペリカンのベンチマーク

もちろん、自転車に乗るペリカンの話もしました:

56:10—ペリカンが自転車に乗っている絵をどれだけ上手く描けるかと、他のすべての面でどれだけ優れているかの間には、非常に強い相関があるように見えます。しかも、なぜそうなるのかを誰も僕に説明できないんです。[...]

「もし研究所がベンチマークを不正に攻略したらどうするの?」と人々が聞いてくるので、僕の答えはいつも同じです。つまり、人生から欲しいのは、ただ『自転車に乗るペリカンのとても良い写真』だけです。もし世界中のあらゆるAI研究所を騙して、ベンチマークで不正をさせてでもそれを手に入れることができるなら、それで僕の目的は達成される。

59:56—人が見落としがちな点として、この領域は本質的に面白いんだと思います。ものすごく高価で、電力を食い、そして「史上最先端の計算機」だとされているコンピュータがある。そこに「自転車に乗っているペリカンを描け」と頼むと、5歳の子どもが描いたみたいな絵になる。これが僕には本当におかしくてたまりません。

そして最後に、オウムについての良いニュースを少し

レニーは、番組を締めるにあたって、リスナーに向けて他に何か伝えたいことはあるかと聞いたので、今この世界でいちばん良いニュースを選びました。

1:38:10—ニュージーランドには、カカポ(Kākāpō)と呼ばれる珍しいオウムがいます。世界に残っているのはこのオウムだけで250羽ほどです。飛べない夜行性のオウムで、美しい緑色をしたずんぐりした見た目の子たちです。そして朗報は、2026年にかけて繁殖の調子がものすごく良いこと、

繁殖するのは、ニュージーランドのリム(Rimu)の木が大量結実の季節を迎えたときだけです。そしてリムの木がそういう状態になっていないのは2022年以来—そのため、ここ4年間で生まれたカカポの雛は1羽もいませんでした。

今年はリムの木が実をつけています。カカポは繁殖しています。新しく生まれた雛が何十羽もいます。本当に、本当に良い時期です。ニュージーランドの珍しいオウムにとって素晴らしいニュースで、ぜひ調べてみてください。とても魅力的です。

みんな雛2羽のいるラキウラ(Rakiura)の巣でのライブ配信を見ましょう!

YouTubeチャプター

こちらが、レニーのチームがYouTube動画用に定義したチャプターの全リストです:

  • 00:00: サイモン・ウィリソンの紹介
  • 02:40: 2025年11月の転換点
  • 08:01: AIによるコーディングで今できること
  • 10:42: バイブ・コーディングとエージェント的エンジニアリング
  • 13:57: ダークファクトリー・パターン
  • 20:41: ボトルネックがどこへ移ったか
  • 23:36: 人間の脳が引き続き価値を持つ場所
  • 25:32: ソフトウェアエンジニアの擁護
  • 29:12: 経験豊富なエンジニアがより良い結果を出せる理由
  • 30:48: 恒久的な下層階級を避けるための助言
  • 33:52: 自分のスキルを増幅するためにAIに寄せる
  • 35:12: なぜサイモンはこれまでで一番頑張って働いていると言うのか
  • 37:23: 2022年以前に人が書いたコードの市場
  • 40:01: 予測: 2026年末までにエンジニアの50%が、AIコードの95%を書いている
  • 44:34: 安いコードが与える影響
  • 48:27: サイモンのAIスタック
  • 54:08: 研究にAIを使う
  • 55:12: ペリカンに乗って自転車に乗るベンチマーク
  • 59:01: AIの本質的なバカバカしさ
  • 1:00:52: 自分ができることをため込む
  • 1:08:21: より良いAIコードのための赤/緑TDDパターン
  • 1:14:43: 良いテンプレートでプロジェクトを始める
  • 1:16:31: 致命的なトリフレクタとプロンプトインジェクション
  • 1:21:53: 「97%の有効性」はなぜ失格点なのか
  • 1:25:19: 逸脱の正常化
  • 1:28:32: OpenClaw: みんなが見過ごしているセキュリティの悪夢
  • 1:34:22: サイモンにとって次に何が来るか
  • 1:36:47: 無成果(納品なし)のコンサル
  • 1:38:05: カカポのオウムに関する朗報
2026年4月2日 2nd April 2026 20:40に投稿 · MastodonBlueskyTwitter、または私のニュースレター購読をフォローしてください

これはサイモン・ウィリソンによる、レニーのPodcastでの「エージェント的エンジニアリング」に関する会話のハイライトです。2026年4月2日に投稿されました。

ai 1942 kakapo 9 generative-ai 1723 llms 1689 podcast-appearances 37 coding-agents 188 agentic-engineering 37

前の記事: Mr. Chatterboxは(弱い)ヴィクトリア朝時代の倫理的に訓練されたモデルで、自分のコンピュータ上で動かせます

月次ブリーフィング

$10/月で私をスポンサーし、今月の最も重要なLLMの進展を厳選したメールダイジェストを受け取ってください。

私にお金を払って、あなたに送る量を減らしてもらってください!

スポンサー&購読