Gemini-SQL2 が BIRD で
80% の壁を突破

Gemini 3.1 Pro ベースの Gemini-SQL2 が BIRD text-to-SQL ベンチマークで実行精度 80.04% を達成し、単一モデル首位に立ちました。BI・分析ダッシュボードへの LLM 組み込みを現実的にする精度水準です。

AI Navigate 編集部·2026.06.13·読了 6分

背景

60〜70% 台が長年の壁——
手動修正が欠かせなかった

Text-to-SQL は「自然言語の質問を SQL クエリに変換する」タスクで、BI ダッシュボードや分析ツールへの LLM 組み込みで注目されてきました。しかし精度は長年 60〜70% 台に留まり、誤った SQL が生成されるリスクが高く、実際の分析業務では人間によるレビューが必須でした。

Gemini 3.1 Pro をベースにした Gemini-SQL2 が BIRD text-to-SQL ベンチマークで 80.04% の実行精度を達成し、単一モデル部門の首位に立ちました。スキーマ・グラウンディングの実装パターンも公開されています。

スキーマ・グラウンディング

精度向上の鍵は
スキーマの精密な入力

Gemini-SQL2 のアーキテクチャに加えて、スキーマ定義を正確にモデルに伝える「グラウンディング」手法が公開されています。

FIG. スキーマ情報を精密に入力することで SQL 生成精度が大幅に向上

公開されたスキーマ・グラウンディングのパターンは、テーブル定義・カラム型・外部キー関係をモデルに正確に伝える実装方法を示しています。Gemini を使っていない場合でも、このパターンは他のモデルの Text-to-SQL 精度向上に応用できる可能性があります。

実務への影響

BI ダッシュボードへの
LLM 組み込みが現実的に

80% の精度は「まだ完全ではない」ものの、標準的な BI・分析クエリの多くをカバーできる水準です。Snowflake や Databricks 等の中間ツールを挟まず Google 純正で Text-to-SQL を完結したい組織には選択肢が広がります。残り 20% の誤りに対する人間レビューの仕組みを設計すれば、今すぐ部分的な導入を検討できます。

60〜70% 台が長年の壁——手動修正が欠かせなかった

精度向上の鍵はスキーマの精密な入力

BI ダッシュボードへのLLM 組み込みが現実的に

60〜70% 台が長年の壁——
手動修正が欠かせなかった

精度向上の鍵は
スキーマの精密な入力

BI ダッシュボードへの
LLM 組み込みが現実的に