【Antigravity】Gemini 3.1 Pro × Flash × Claude Opus 4.6ハイブリッド・ルーティング術

note / 2026/4/7

💬 オピニオンDeveloper Stack & InfrastructureSignals & Early TrendsTools & Practical Usage

要点

  • Gemini 3.1 Pro、Flash、Claude Opus 4.6の複数モデルを用途に応じて使い分ける「ハイブリッド・ルーティング」方針を提示している。
  • モデルごとの特性(得意な処理や応答品質、速度など)を前提に、どの入力・タスクをどのモデルへ振り分けるかの設計論が中心になっている。
  • 単一モデル依存を避け、性能とコスト(やレイテンシ)のバランスを取りながらワークフロー全体の最適化を狙う内容。
  • 実運用での判断基準・切り替え手順の考え方が示され、LLM利用の実装/運用設計に直結する。
  • タイトルに「Antigravity」とあるように、組み合わせで弱点を相殺し全体性能を押し上げる発想の適用を強調している。
見出し画像

【Antigravity】Gemini 3.1 Pro × Flash × Claude Opus 4.6ハイブリッド・ルーティング術

43
だいあろごす。

最近、Antigravityを業務でガッツリ使い込んでいるんですが、本格運用するにつれてある悩みに直面しました。

「とりあえず一番賢いモデルに全部投げちゃう問題」です。

確かにGemini 3.1 Proはめちゃくちゃ優秀です。
でも、ちょっとしたTypo修正やテストコードの雛形作りに毎回Proを呼ぶのは、ぶっちゃけオーバースペックなんですよね。
レスポンスを待つ数秒がチリツモでストレスになりますし、何より気がつくとレート制限に引っかかって作業が完全にストップ……なんて経験、皆さんもあるんじゃないでしょうか。

そこで最近行き着いたのが、Googleの「Gemini 3.1 Pro」と超高速な「Gemini 3 Flash」、そしてAnthropicの最新鋭「Claude Opus 4.6」を、タスクの性質に合わせてIDE上で瞬時に切り替える運用です。

今回は、Antigravityの待ち時間を極限まで減らしつつ、コードの品質を最高値に保つ「ハイブリッド・ルーティング」の実践手順を紹介します。



3大モデルの「超個人的」適材適所

モデルの切り替え設定の前に、まずは私が現場でどう使い分けているかを紹介します。それぞれの強みを活かすのが一番の近道です。

1. Gemini 3 Flash:雑用を光の速さでこなす「若手ホープ」

  • 用途: Typo修正、単純なテストコード生成、Docstringの追加、簡単なメソッドの抽出。

  • 理由: とにかく爆速。体感ですが、Proの数倍のスピードで返ってきます。待たされるストレスがほぼゼロでトークン消費も軽いため、息をするようにガンガン回せます。「ちょっとここ整えて」レベルのタスクは全部Flashで十分です。

2. Gemini 3.1 Pro:現場を回す「優秀なテックリード」

  • 用途: 新機能の土台作り、複数ファイルにまたがるリファクタリング、外部APIとの結合。

  • 理由: 大量のコンテキストを飲み込める容量の大きさと、安定感が持ち味です。社内ドキュメントや既存の膨大なコードベースを読み込ませた上で、「このプロジェクトの規約に沿って、このエンドポイントの処理を書いて」といった、文脈を読ませる中〜重量級のタスクはProの独壇場です。

3. Claude Opus 4.6:ここぞで頼れる「天才アーキテクト」

  • 用途: 原因不明の複雑なバグ調査、高度なアルゴリズムの実装、ゼロからのデータベース設計。

  • 理由: 論理的な推論の深さは、やはりOpus 4.6が頭一つ抜けています。「なんか動かないんだけど…」というフワッとしたエラーログと関連ファイル数個を投げたとき、コードの深い階層の矛盾や、非同期処理の競合などを一発で突き止める打率が異常に高いです。レスポンスは重めですが、人間が数時間悩むバグを数分で解決してくれるなら安いものです。


Antigravityでの設定術(Agent Manager活用)

この3つを都度設定画面からプルダウンで選ぶのは面倒なので、Antigravityの「Agent Manager」を使って専用のプロファイルを作り、ショートカットで呼び出せるようにします。

手順

  1. Antigravityの設定から「Agent Manager」を開く。

  2. 「New Profile」から以下の3つのエージェントを作成する。

    • Agent A (Flash): Modelを gemini-3-flash に設定。System Promptには「簡潔に、コードだけを素早く出力して」と記述。

    • Agent B (Pro): Modelを gemini-3.1-pro に設定。System Promptには「プロジェクトのコーディング規約(SKILL.md)を厳守し、堅牢なコードを書いて」と記述。

    • Agent C (Opus): Modelを claude-opus-4.6 に設定。System Promptには「ステップバイステップで深く推論し、エッジケースを考慮して最適解を提示して」と記述。

  3. それぞれのプロファイルにショートカットキー(例:Cmd + Shift + 1 / 2 / 3)を割り当てる。

これで、エディタ上でコードを選択し、ショートカットを叩くだけで「誰に頼むか」を瞬時に切り替えられるようになります。


実践:最強のリレー開発ワークフロー

実際の開発フローは、まるでチーム内でタスクをパス回しするような感覚になります。

  1. Flashで骨組みを作る まずは雑にコメントを書いてFlashを呼び出し、クラスや関数のガワ(モック)を秒速で作らせます。

  2. Proで肉付け・全体最適化 できたモックをもとに、Proを呼び出して「既存の〇〇モジュールと連携するように処理を実装して」と指示。全体像を把握した実装を行わせます。

  3. Opus 4.6で最後の壁を突破する 実装中に「あれ、ここのライフサイクルおかしくない?」といった複雑な問題にぶつかったら、すかさずOpus 4.6にバトンタッチ。解決策を論理的に導き出してもらいます。

  4. 再びFlashでテストを書く 完成したコードを選択して、Flashに「RSpec書いて」と投げて終了。


注意点:コンテキストの引き継ぎについて

モデルを切り替えると、「直前まで別のモデルと会話していた文脈が飛ぶのでは?」と不安になるかもしれません。

現在のAntigravityの仕様では、同一スレッド内であればモデルを切り替えても直前までの会話履歴(コンテキスト)は保持されます。ただし、FlashからOpus 4.6に切り替えた瞬間、これまでの会話履歴が一気にOpus 4.6のトークンとして計算・消費されるため、あまりに長いスレッドの終盤でOpusに切り替えると、一発でレート制限を食らう可能性があります。

「Opusに頼むときは、問題を切り出して新しいスレッドでピンポイントに聞く」のが、コスト的にも精度向上にもおすすめです。


おわりに

「とりあえずPro」という思考停止をやめて、タスクの解像度に合わせてモデルを切り替えるようにしてから、開発のテンポが劇的に改善しました。AIの待ち時間にスマホを触る無駄な時間も激減しています。

Antigravityと複数モデルの恩恵をフルに引き出すこの「ハイブリッド・ルーティング」、設定は数分で終わるので、ぜひ明日の業務から試してみてください!

それでは今回はここまで(*'▽')ノシ

ダウンロード
copy

いいなと思ったら応援しよう!

だいあろごす。 よろしければ応援お願いします!
チップで応援する

この記事が参加している募集

43