過去数か月、AI画像生成のツール群を作ってきました。そして多くの友人から、「2026年にゼロから始めるなら、どんなスタックを使う?」と聞かれました。率直に答えると、ここで踏んだ落とし穴も含めて話します。
これは机上の空論ではありません。Nano AI(無料のNano Banana Proワークベンチ)で本番運用をして見てきたこと、そして次のプロダクトに組み込みたいことに基づいています。
The Stack
| レイヤー | 選択 | 理由 |
|---|---|---|
| フロントエンド | Next.js 15(App Router)+ Tailwind | 退屈なくらい堅実、速い。SEOのためのサーバーコンポーネント |
| 認証 | NextAuth | OAuth(Google/GitHub)でユーザーの95%をカバー |
| DB | PostgreSQL(Supabase または Neon) | 無料枠でMVPをカバーでき、必要になればスケールする |
| 画像モデル | Nano Banana Pro / SDXL フォールバック | 1画像あたりのコストが、ユニットエコノミクスを決める |
| ストレージ | Cloudflare R2 | S3互換。画像量が多いアプリならS3の10分の1の安さ |
| 決済 | Stripe | これを作り直す必要はない |
| ホスティング | Vercel(フロントエンド)+ Cloudflare Workers(画像プロキシ) | エッジでコールドスタートに強い |
| 分析 | PostHog(セルフホスト) | プライバシーに配慮しつつ、イベントを完全にコントロールできる |
MVP規模での総固定費(月額): 約$30-50。本当のコストは、画像ごとの推論(inference)です。
The Critical Decision: Where Do You Run the Model?
これはAI画像SaaSにおける「勝負の分岐」です。選択肢は3つ:
Option 1: Hosted API (OpenAI, Stability)
- ✅ 運用ゼロ
- ❌ 画像あたりのコストが高い — 無料プランを壊す
- ❌ ベンダーロックイン
Option 2: Self-host on RunPod / Modal / Replicate
- ✅ 画像あたりのコストを下げられる
- ❌ コールドスタートがつらい(アイドル後の最初のリクエストが10〜30秒)
- ❌ 運用が増える
Option 3: Use a small efficient model via cheap inference provider
- ✅ 最良の画像あたりコスト(Nano Banana Proは$0.001〜0.003の範囲)
- ✅ サブ秒の推論
- ❌ 複雑なプロンプトに対しては、DALL-E 3より品質の上限が低い
フリーミアムSaaSでは、無料プランを提供するなら選択肢3以外ではユニットエコノミクスが成立しません。
私はプロバイダー別の実際のコスト内訳について書きました。最も高い選択肢と最も安い選択肢の差は40倍です。
Free Tier Strategy
ここが多くのビルダーが間違えるポイントです。うまくいくのはこれ:
Don't offer "unlimited free"
ボットによる不正利用を招きます。1週間もすると、誰かの大量生成コストをあなたが払うことになります。
Don't offer "10 free per month"
訪問者は最初のセッションで上限に到達し、そのまま戻ってきません。
Do offer "10 free per day"
毎日リセットされます。エンゲージメントが保て、コンバージョンのためにプロダクトを十分な回数だけ見せられます。
実装: IP+Cookieで紐づけたRedisまたはPostgresのカウンター。24時間ごとにリセット。
The Bot Abuse Problem
AI画像ジェネレーターを公開して最初の1週間で、次のようなことが起きます:
/api/generateエンドポイントにスクレイピングが来る- 使い捨てメールで100アカウント作るユーザー
- レジデンシャルプロキシによる分散攻撃
多層防御:
- Cloudflare Turnstile をサインアップに設定(無料、reCAPTCHAより軽い)
- IP+デバイス指紋でレート制限(IPだけでは不十分。プロキシは安い)
- 画像ハッシュの重複排除 — 同じプロンプト+シードが今日すでに実行されているなら、キャッシュされた画像を返す
- 振る舞いチェック — 人間は「生成」を押すまでに0.5秒以上かかることが多いが、ボットは違う
What I'd Skip in 2026
1年前は必須に見えたけれど、MVPでは本当は不要なものがいくつかあります:
- カスタム認証フロー — NextAuthがケースの95%をカバーする。最初からスクラッチで作るのは時間の無駄
- マイクロサービス — 1つのNext.jsモノリスで、Vercel上では10K req/minを簡単に捌ける
- 独自のAIモデル — 2026年に自分のモデルをファインチューニングする必要はありません。オープンウェイトのエコシステムで、ほとんどのユースケースは十分に対応できます
- リアルタイム共同作業機能 — 複雑さが増えるだけで、画像生成アプリではほとんど必要ない
Lessons (the hard-won ones)
コストがすべてを決める。 機能を追加する前に、1画像あたりのコストを下げる。そうしないと、お金が減り続ける機械を作ってしまう。
キャッシュを強めに使う。 驚くほど多くの「AI生成」は、似たようなプロンプトを打っているだけです。プロンプト+シードでキャッシュしましょう。
プロンプトUXが悪ければ、モデルの品質上限は重要にならない。 優れたプロンプト入力体験(提案、例、履歴)を作れば、7/10のモデルでも、UXが悪い9/10のモデルに勝ちます。
フリープランのコンバージョンはこの領域では厳しい。 平均は約1〜2%(有料)。0.5%を下回っているなら、価格ではなく「無料→有料」の摩擦(フリクション)を見てください。
画像ホスティングは独立した費目。 1024x1024のPNGを生成するのは1つのコスト。さらに、それを1000人の訪問者に対して保存・配信するのも別のコストです。R2またはB2を使いましょう。
Try the Stack in Action
このスタックが本番で動いている具体例を見たいなら、Nano AIがまさにそれです — Next.js+Nano Banana Pro+Cloudflare R2のストレージ。
ワークベンチを試して、DevToolsで負荷の挙動を見てみると、「選択肢3」が実際にどんな感じか掴めるはずです。
Closing
2026年に面白いのは、固定費月額50ドル未満で、シングル創業者でも本物のAIプロダクトを出荷できることです。ボトルネックはインフラやモデルではありません。ボトルネックは配布(ディストリビューション)とプロンプトUXです。
この領域で何かを作っているなら、ぜひ雑談しましょう。コメント欄にプロジェクトを投稿してください。




