共有:
Text-to-SQL · Google

Gemini-SQL2 が BIRD で
80% の壁を突破

Gemini 3.1 Pro ベースの Gemini-SQL2 が BIRD text-to-SQL ベンチマークで実行精度 80.04% を達成し、単一モデル首位に立ちました。BI・分析ダッシュボードへの LLM 組み込みを現実的にする精度水準です。

AI Navigate 編集部·2026.06.13·読了 6分
BIRD text-to-SQL 実行精度の水準変化 60〜70% 長年の壁 手動修正が必須だった 80.04% Gemini-SQL2 BIRD 単一モデル首位
01
背景

60〜70% 台が長年の壁——
手動修正が欠かせなかった

Text-to-SQL は「自然言語の質問を SQL クエリに変換する」タスクで、BI ダッシュボードや分析ツールへの LLM 組み込みで注目されてきました。しかし精度は長年 60〜70% 台に留まり、誤った SQL が生成されるリスクが高く、実際の分析業務では人間によるレビューが必須でした。

Gemini 3.1 Pro をベースにした Gemini-SQL2 が BIRD text-to-SQL ベンチマークで 80.04% の実行精度を達成し、単一モデル部門の首位に立ちました。スキーマ・グラウンディングの実装パターンも公開されています。


02
スキーマ・グラウンディング

精度向上の鍵は
スキーマの精密な入力

Gemini-SQL2 のアーキテクチャに加えて、スキーマ定義を正確にモデルに伝える「グラウンディング」手法が公開されています。

自然言語の質問 スキーマ・グラウンディング テーブル定義・カラム型 外部キー・インデックス情報 正確な SQL 生成 実行精度 80.04%
FIG. スキーマ情報を精密に入力することで SQL 生成精度が大幅に向上

公開されたスキーマ・グラウンディングのパターンは、テーブル定義・カラム型・外部キー関係をモデルに正確に伝える実装方法を示しています。Gemini を使っていない場合でも、このパターンは他のモデルの Text-to-SQL 精度向上に応用できる可能性があります。

03
実務への影響

BI ダッシュボードへの
LLM 組み込みが現実的に

80% の精度は「まだ完全ではない」ものの、標準的な BI・分析クエリの多くをカバーできる水準です。Snowflake や Databricks 等の中間ツールを挟まず Google 純正で Text-to-SQL を完結したい組織には選択肢が広がります。残り 20% の誤りに対する人間レビューの仕組みを設計すれば、今すぐ部分的な導入を検討できます。

AI Navigate — Daily Update · 2026.06.13