AWSの基調講演はAIを魔法のようだと持ち上げる。だが自社のエンジニアは別の話をする
近道はしない。すべて人の目で確認する、と社内チーム。しかもジュニア開発者の採用は続ける
インタビュー Amazon Storesのディレクターであるスティーブ・タルツァ氏は、自身のチーム—StoreGen—が、小売大手の開発者たちがより速く動けるようにし、摩擦を減らすために存在すると語る。だがAIの命令があっても、譲れない原則がひとつある。人が最初に確認しない限り、何も出荷しない。
私たちは、より多くのジュニアエンジニアが入ってこなくなるところまで行ってはいけない。才能を伸ばし続けなければならない。これらのシステムを保守する人がいなくなってしまう状況に陥ってはならない……
このユニットの焦点は、AWSの顧客ではない。巨大な小売サイトおよび運用に関わる、Amazon内部の開発チームだ。
タルツァ氏は先週のAWSロンドンサミットで語ってくれた。私たちは同氏に、アリソン・ケイ(英国およびアイルランド担当のVP兼マネージング・ディレクター)が基調講演の聴衆に対し、AI技術は「魔法のように感じる」と述べた直後に会った。ケイ氏は例として、生成AIサービスであるBedrockの推論エンジンが、Kiroのエージェント的コーディングサービスを使ったことで、6人のエンジニアによって76日で作り直された事例を挙げた。
「エンジニアたちが眠っている間も、エージェントは作り続けていました」と彼女は説明する。「彼らはコードを書き、テストし、バグを見つけ、修正し、そして24時間体制で展開したのです。」
本紙(The Register)はタルツァ氏に対し、AIにはよく知られたセキュリティや信頼性の問題があるため、この点にはある種の不安や懸念があるのではないかと示した。彼らのチームでは、どんな課題に遭遇しているのか?
「みんなが知っていることですよ」と彼は言う。「幻覚の問題です。ガードレールの範囲内に保つことです。」AIが「あなたが頼んでいないことまでやってしまい、あなたが望んだ以上に踏み込んでしまう」ケースもあるという。
彼は仕様主導の開発の熱心な支持者であり、それがKiroの主要な特徴でした。Kiroは2025年7月に最初のプレビューが行われた際に、その狙いは、AIがコードを書く前に洗練と承認のための一連のタスクを生成するというものでした。
仕様主導の開発は、幻覚やプロンプトインジェクションといった問題を解決するのでしょうか?「いいえ」とTarczaは言います。「せいぜいそれらを減らすだけです。しかも、それでも仕様を越えてしまうケースがまだあります。」
Kiroは昨年、サービス障害に関与していた可能性があるものの、これは公式には否定されており、事故の原因は従業員のミスだとされています。
では、エージェント型AIはどのようにして安全で信頼できるものにできるのでしょうか?「私たちは、エンジニアは常に出力を見ている必要がある、という立場を取っています。誰かがそれを見て検証しない限り、出荷されません。仕様主導の開発は、そのためにかかる時間を減らすのに役立ちます。というのも、最終的に、望まれる形にだいたい整った状態で渡されるからです」とTarczaは私たちに語っています。
エンジニアがコードをレビューしなければならない、ということは、レビューするためのスキルがあることを意味します。しかし、AIの進歩を背景に企業がエンジニアをレイオフしている現状では――AWSを含む――人間がレビューしていないコードが、ますます本番投入される可能性が高まっていないでしょうか?
「私はこれについて非常に強いスタンスを持っています」とTarczaは言います。「放っておけば、あなたが目にするようになっていくことの自然な帰結だと思います。でも、それは誤った結果です……新しく入ってくる若手エンジニアがいないところまで行ってしまってはいけない。私たちはタレントを育て続ける必要があります。これらのシステムを保守する人がいない状況に陥ってはなりません。」
必要とされる手作業のレビューがこれだけあるなら、AI開発を魔法と呼ぶのは適切なのでしょうか?「そう言える面はあります」とTarczaは言います。「私たちのエンジニアは、コアのエンジニアリング、コードを書くこと、ソフトウェア設計に取り組んでいる時間は30%未満です。プロセスの他の側面にかなりの時間を費やしています。私たちがやったのは、摩擦を取り除いて、常にステータスレポートを書かなくて済むようにすることです。これらのフェーズをより早く通過できる、という意味で“魔法の箱”です。
「しかし、それが“魔法の箱”のようにステップ1から最終ステップまで連れていってくれるわけではありません。そして、私たちがそういう世界を望んでいるとは思いません。」
基調講演のテーマはエージェントの時代でしたが、Tarczaは「エージェント型AI」という言葉にあまり乗り気ではありません。
「人間主導のプロセスを取り上げ、それをAIを中心に据えて再アーキテクトすることに注力すべきだと思います」と彼は私たちに語っています。それでもなお、デプロイメントのようなエージェント型のアクションについて、AIが生成したコードと同じ見方をしています。「現時点では、AIが行う可能性のあるあらゆる“変異”のステップについて、人間が承認する必要があります」と彼は言います。「それは、誰かが読めるようにドキュメントを公開するところまで続きます。」
- AIのサプライチェーン攻撃はマルウェアすら不要……汚染したドキュメントを投稿するだけ
- Mozillaがcqを導入、「エージェントのためのStack Overflow」だと説明
- OpenAIは最新モデルが回りくどくならない可能性が低いと述べる
- Geminiは健康情報についてユーザーに嘘をついたとし、「相手を気分良くしたかった」と語る
彼はさらに、「少なくともStoresでは、デプロイの支援にAIを使っていません。AWSが提供している自動デプロイ用の仕組みが素晴らしく、それは決定論的です。決定論的なシステムがあり、私たちが望む結果を達成できるなら、それが望ましい」と付け加えています。
Tarczaが説明しているのは、直前の基調講演で耳にした“浮き足立った”エージェント型AIの誇大な宣伝とは対照的に見える、慎重なアプローチです。
トークンコストが上がる中でも、AIはまだ費用に見合うのでしょうか?「これについて考えるうえで最も高いレベルの思考は、『大きなイノベーションを見逃した場合のコストはいくらか』ということです。やらないコストは、トークンコストよりも、ほぼ確実に高くなると思います」と彼は言います。®




