Google Stitch 2.0：数秒でシニア級UIを生成できるが、編集はまだ壊れる

Dev.to / 2026/4/22

💬 オピニオンSignals & Early TrendsTools & Practical UsageModels & Research

原文を読む →

共有:

要点

Google Stitch 2.0は、視覚的な階層設計、余白やアラインメントの整ったレイアウト、まとまりのあるコンポーネント構造といった点で、ほぼ「シニア級」に近いUIを素早く生成できます。
Gemini 3 Flashを使う反復（イテレーション）ループが特に速く、複数のUIバリエーションを瞬時に出せるため探索コストを大きく削減できます。
指示からデザインへの翻訳の精度向上や、プロジェクト単位のDESIGN.mdによって、反復を重ねても出力の一貫性が高まります。
一方で、「Edit with AI」によるコンポーネント単位の作り込みをしようとすると挙動が不安定になり、編集時にフィードバックなく応答しなくなることもあります。
総合すると、Stitch 2.0はUI生成とエクスポートは得意ですが、実プロダクトで必要になる“制御されたコンポーネント単位の改修”には弱い、という評価です。

Google Stitch 2.0は、数秒で本番品質のUIを生成できます。

しかし、単一のコンポーネントをきめ細かく調整しようとした瞬間に、システムが崩れ始めます。

本記事は、実際のプロダクトのフローを構築しながらStitchをハンズオンで評価し、実運用でどこが優れていてどこで失敗するのかに焦点を当てます。

TL;DR

UI生成の品質が非常に高い（シニアレベルに近い出力）
Gemini 3 Flashによる反復速度が非常に速い
DESIGN.mdが出力間の一貫性を向上させる
コンポーネント単位の編集は信頼できない
フィードバックなしでエージェントが応答しなくなることがある

結論：生成には強いが、制御された改善には弱い

デモ動画

背景

この評価は、AIによる農業アプリケーションのための実際のプロダクトフローを構築しながら行いました。

ワークフローには以下が含まれていました：

プロンプト → UI生成
複数画面のナビゲーション
「Edit with AI」によるコンポーネント単位の編集
エクスポートのパイプラインテスト

うまくいく点

高品質なUI生成

Gemini 3.1 Pro（「Thinking」モード）を使用すると、Stitchは次のようなレイアウトを生成します：

強い視覚的階層
クリーンな余白と整列
一貫したコンポーネントの構造化

出力は、多くの場合、最初の反復としてシニア〜ミッドシニアのデザイナーが作るような内容に近いです。

速い反復ループ

Gemini 3 Flashを使うと：

複数のUIバリエーションが数秒で生成される
探索コストが大幅に削減される

これにより、初期段階のデザインサイクルを1つのインタラクションループに圧縮できます。

指示からデザインへの翻訳が正確

以前のバージョンと比べて：

プロンプトの解釈がより一貫している
レイアウトの意図が保持される
コンポーネントのグルーピングが概ね正しい

DESIGN.mdが一貫性を向上させる

以下のようなデザインルールを定義すると：

色
タイポグラフィ
コンポーネントの制約

反復を重ねてもより一貫した出力が得られます。

エクスポート層が適切に構造化されている

利用可能な出力には以下が含まれます：

AI Studio
Figma
コードエクスポート

これにより、デザインと実装の間に明確なブリッジが作られます。

どこで壊れるか

ケーススタディ：Scanボタンコンポーネント

浮かせた「Scan Crop」ボタンを微調整している最中に、以下の挙動が観測されました。

意図した挙動

デフォルト状態：円形アイコンボタン
最初の操作："Scan"ラベル付きのピルへ展開
2回目の操作：スキャンアクションを実行

ステップ1：Edit with AI

結果：

ボタンが円形の形に畳まれた（想定通り）
スキャンのアイコンが削除された（想定外）

この結果、視覚的に曖昧で、明確な操作感（affordance）のないコントロールになりました。

ステップ2：的を絞った修正

指示：

"他のすべてのプロパティは変更せずに、スキャンアイコンを追加して"

結果：

目に見える更新がない
フィードバックがない
エラーのシグナルがない

ステップ3：繰り返しの試行

同じ指示を複数回発行した
変化は観測されない

結果

編集パイプラインが応答しなくなった
コンポーネントをこれ以上改善できなかった
編集フローを諦める必要があった

分析

この挙動は、単なる生成ミスというよりシステム全体の制限を示しています。

弱いコンポーネント単位の編集

システムは、次のようなスコープ付きの修正が苦手です：

構造を保持しながら、1つの属性だけを変更する

決定論的な制御の欠如

編集は：

信頼できない
正確に適用されない

エージェント状態の不整合

システムは次のことができないようです：

過去の編集コンテキストを維持する
段階的な変更を適用する

サイレントフェイル（無音の失敗）

以下がありません：

エラーフィードバック
リトライ機構
復旧のためのガイダンス

システムは単に応答を止めます。

なぜ重要か

これは実用上の使いやすさに直結します：

反復的な改善に対する信頼が下がる
制御された編集ではなく再生成を強いられる
後工程のプロトタイピングが遅くなる

Stitchは生成には強いものの、改善（リファイン）では信頼性がありません。

欠けている機能

本番レベルのワークフローには、次のようなものが必要です：

決定論的な編集モード

スコープ付きで予測可能な変更を適用すること。

コンポーネントのロック

特定の属性を編集している間も構造を保持すること。

フィードバックシステム

編集が失敗したときに明確なシグナルを出すこと。

ビジュアル・ディフ

変更前と変更後を表示すること。

リトライ機構

失敗した編集を自動的に処理すること。

戦略的観察

Stitch 2.0は、生成の問題をほぼ解決しています。

残っている課題は「制御」です。

最終評価

強み：

高品質なUI生成
高速な反復
AIネイティブなデザインワークフローへの強い方向性

制約：

編集が脆い
決定論的な制御が欠如している
エージェントの信頼性に問題がある

結論

Stitchは、すでに非常に高能力なプロトタイピングシステムです。

しかし、コンポーネント単位の編集が信頼できるようになるまでは、本番用途のための従来のデザインワークフローを置き換えることはできません。

現時点では：

素早い生成のために使う
精密な改善のために頼りすぎない

Black Hat USA

AI Business

視覚におけるオートエンコーダと表現学習

Dev.to

あらゆるAI投資アプリはあなたのデータを欲しがる――信用できなかったので、オフラインで自分のものを作った

Dev.to

URLひとつでClaudeを操作可能に—Chrome拡張「Send to Claude」が非常に便利

Dev.to

メタはAIエージェントの学習のために、従業員のPC上での操作を追跡へ

The Verge

要点

TL;DR

デモ動画

背景

うまくいく点

高品質なUI生成

速い反復ループ

指示からデザインへの翻訳が正確

DESIGN.mdが一貫性を向上させる

エクスポート層が適切に構造化されている

どこで壊れるか

ケーススタディ：Scanボタンコンポーネント

意図した挙動

ステップ1：Edit with AI

ステップ2：的を絞った修正

ステップ3：繰り返しの試行

結果

分析

弱いコンポーネント単位の編集

決定論的な制御の欠如

エージェント状態の不整合

サイレントフェイル（無音の失敗）

なぜ重要か

欠けている機能

決定論的な編集モード

コンポーネントのロック

フィードバックシステム

ビジュアル・ディフ

リトライ機構

戦略的観察

最終評価

結論

関連記事

Black Hat USA

視覚におけるオートエンコーダと表現学習

あらゆるAI投資アプリはあなたのデータを欲しがる――信用できなかったので、オフラインで自分のものを作った

URLひとつでClaudeを操作可能に—Chrome拡張「Send to Claude」が非常に便利

メタはAIエージェントの学習のために、従業員のPC上での操作を追跡へ

関連おすすめサービス

Notta搭載AI議事録イヤホン ZENCHORD1

AI搭載ボイスレコーダー Plaud

画像高画質化AIツール Aiarty Image Enhancer