Computer Use · Agent Automation
画面操作 AI が Flash 価格帯に降りた
Pro モデル必須・専用ハーネス必須だったブラウザ自動操作が、Gemini 3.5 Flash 単体で動くようになった。コスト構造が変わると、誰が恩恵を受けるのか。
01
The Shift
「Pro だけが使える機能」が Flash に降りるとき
Gemini 3.5 Flash にコンピューター制御機能が直接組み込まれた。ブラウザ上での要素クリック、テキスト入力、スクロール——従来は上位の Pro モデルと専用エージェントフレームワークが必要だったこれらを、単一の Flash モデル呼び出しでこなせるようになった。
半年前の典型的な構成は「Gemini 1.5 Pro + LangChain などのエージェントループ + ブラウザドライバ」だった。各層に運用コストがあり、PoC を開始するだけで数週間かかるケースも珍しくなかった。
02
Before vs. After
コスト構造の変化
| これまで(Pro + ハーネス) | 今後(Flash 単体) |
|---|---|
| Pro 料金が前提条件 | Flash 料金で PoC 開始 |
| エージェントフレームワーク必須 | モデル API だけで完結 |
| セットアップに数週間 | 数行の API 呼び出し |
| 商用採用ハードルが高い | 中小チームも現実的な選択肢 |
03
Impact by Persona
誰に・何が変わるか
エンジニア・開発チーム
ブラウザ自動化の PoC が Flash 料金で回せる。本格投資前のコスト検証が現実的になった。
プロダクト・業務自動化
フォーム入力・在庫確認・申請ワークフローを、ツール追加なしに AI 一本で構築できる。
個人・趣味ユーザー
日常的な AI チャット利用には影響しない。趣味の自動化を始めたい人にはコスト障壁が下がる。