Google Stitch 2.0:数秒でシニア級UIを生成できるが、編集はまだ壊れる

Dev.to / 2026/4/22

💬 オピニオンSignals & Early TrendsTools & Practical UsageModels & Research

要点

  • Google Stitch 2.0は、視覚的な階層設計、余白やアラインメントの整ったレイアウト、まとまりのあるコンポーネント構造といった点で、ほぼ「シニア級」に近いUIを素早く生成できます。
  • Gemini 3 Flashを使う反復(イテレーション)ループが特に速く、複数のUIバリエーションを瞬時に出せるため探索コストを大きく削減できます。
  • 指示からデザインへの翻訳の精度向上や、プロジェクト単位のDESIGN.mdによって、反復を重ねても出力の一貫性が高まります。
  • 一方で、「Edit with AI」によるコンポーネント単位の作り込みをしようとすると挙動が不安定になり、編集時にフィードバックなく応答しなくなることもあります。
  • 総合すると、Stitch 2.0はUI生成とエクスポートは得意ですが、実プロダクトで必要になる“制御されたコンポーネント単位の改修”には弱い、という評価です。

Google Stitch 2.0は、数秒で本番品質のUIを生成できます。

しかし、単一のコンポーネントをきめ細かく調整しようとした瞬間に、システムが崩れ始めます。

本記事は、実際のプロダクトのフローを構築しながらStitchをハンズオンで評価し、実運用でどこが優れていてどこで失敗するのかに焦点を当てます。

TL;DR

  • UI生成の品質が非常に高い(シニアレベルに近い出力)
  • Gemini 3 Flashによる反復速度が非常に速い
  • DESIGN.mdが出力間の一貫性を向上させる
  • コンポーネント単位の編集は信頼できない
  • フィードバックなしでエージェントが応答しなくなることがある

結論:生成には強いが、制御された改善には弱い

デモ動画

背景

この評価は、AIによる農業アプリケーションのための実際のプロダクトフローを構築しながら行いました。

ワークフローには以下が含まれていました:

  • プロンプト → UI生成
  • 複数画面のナビゲーション
  • 「Edit with AI」によるコンポーネント単位の編集
  • エクスポートのパイプラインテスト

うまくいく点

高品質なUI生成

Gemini 3.1 Pro(「Thinking」モード)を使用すると、Stitchは次のようなレイアウトを生成します:

  • 強い視覚的階層
  • クリーンな余白と整列
  • 一貫したコンポーネントの構造化

出力は、多くの場合、最初の反復としてシニア〜ミッドシニアのデザイナーが作るような内容に近いです。

速い反復ループ

Gemini 3 Flashを使うと:

  • 複数のUIバリエーションが数秒で生成される
  • 探索コストが大幅に削減される

これにより、初期段階のデザインサイクルを1つのインタラクションループに圧縮できます。

指示からデザインへの翻訳が正確

以前のバージョンと比べて:

  • プロンプトの解釈がより一貫している
  • レイアウトの意図が保持される
  • コンポーネントのグルーピングが概ね正しい

DESIGN.mdが一貫性を向上させる

以下のようなデザインルールを定義すると:

  • タイポグラフィ
  • コンポーネントの制約

反復を重ねてもより一貫した出力が得られます。

エクスポート層が適切に構造化されている

利用可能な出力には以下が含まれます:

  • AI Studio
  • Figma
  • コードエクスポート

これにより、デザインと実装の間に明確なブリッジが作られます。

どこで壊れるか

ケーススタディ:Scanボタンコンポーネント

浮かせた「Scan Crop」ボタンを微調整している最中に、以下の挙動が観測されました。

意図した挙動

  • デフォルト状態:円形アイコンボタン
  • 最初の操作:"Scan"ラベル付きのピルへ展開
  • 2回目の操作:スキャンアクションを実行

ステップ1:Edit with AI

結果:

  • ボタンが円形の形に畳まれた(想定通り)
  • スキャンのアイコンが削除された(想定外)

この結果、視覚的に曖昧で、明確な操作感(affordance)のないコントロールになりました。

ステップ2:的を絞った修正

指示:

"他のすべてのプロパティは変更せずに、スキャンアイコンを追加して"

結果:

  • 目に見える更新がない
  • フィードバックがない
  • エラーのシグナルがない

ステップ3:繰り返しの試行

  • 同じ指示を複数回発行した
  • 変化は観測されない

結果

  • 編集パイプラインが応答しなくなった
  • コンポーネントをこれ以上改善できなかった
  • 編集フローを諦める必要があった

分析

この挙動は、単なる生成ミスというよりシステム全体の制限を示しています。

弱いコンポーネント単位の編集

システムは、次のようなスコープ付きの修正が苦手です:

  • 構造を保持しながら、1つの属性だけを変更する

決定論的な制御の欠如

編集は:

  • 信頼できない
  • 正確に適用されない

エージェント状態の不整合

システムは次のことができないようです:

  • 過去の編集コンテキストを維持する
  • 段階的な変更を適用する

サイレントフェイル(無音の失敗)

以下がありません:

  • エラーフィードバック
  • リトライ機構
  • 復旧のためのガイダンス

システムは単に応答を止めます。

なぜ重要か

これは実用上の使いやすさに直結します:

  • 反復的な改善に対する信頼が下がる
  • 制御された編集ではなく再生成を強いられる
  • 後工程のプロトタイピングが遅くなる

Stitchは生成には強いものの、改善(リファイン)では信頼性がありません。

欠けている機能

本番レベルのワークフローには、次のようなものが必要です:

決定論的な編集モード

スコープ付きで予測可能な変更を適用すること。

コンポーネントのロック

特定の属性を編集している間も構造を保持すること。

フィードバックシステム

編集が失敗したときに明確なシグナルを出すこと。

ビジュアル・ディフ

変更前と変更後を表示すること。

リトライ機構

失敗した編集を自動的に処理すること。

戦略的観察

Stitch 2.0は、生成の問題をほぼ解決しています。

残っている課題は「制御」です。

最終評価

強み:

  • 高品質なUI生成
  • 高速な反復
  • AIネイティブなデザインワークフローへの強い方向性

制約:

  • 編集が脆い
  • 決定論的な制御が欠如している
  • エージェントの信頼性に問題がある

結論

Stitchは、すでに非常に高能力なプロトタイピングシステムです。

しかし、コンポーネント単位の編集が信頼できるようになるまでは、本番用途のための従来のデザインワークフローを置き換えることはできません。

現時点では:

  • 素早い生成のために使う
  • 精密な改善のために頼りすぎない