Gemini-SQL2 が BIRD で
80% の壁を突破
Gemini 3.1 Pro ベースの Gemini-SQL2 が BIRD text-to-SQL ベンチマークで実行精度 80.04% を達成し、単一モデル首位に立ちました。BI・分析ダッシュボードへの LLM 組み込みを現実的にする精度水準です。
60〜70% 台が長年の壁——
手動修正が欠かせなかった
Text-to-SQL は「自然言語の質問を SQL クエリに変換する」タスクで、BI ダッシュボードや分析ツールへの LLM 組み込みで注目されてきました。しかし精度は長年 60〜70% 台に留まり、誤った SQL が生成されるリスクが高く、実際の分析業務では人間によるレビューが必須でした。
Gemini 3.1 Pro をベースにした Gemini-SQL2 が BIRD text-to-SQL ベンチマークで 80.04% の実行精度を達成し、単一モデル部門の首位に立ちました。スキーマ・グラウンディングの実装パターンも公開されています。
精度向上の鍵は
スキーマの精密な入力
Gemini-SQL2 のアーキテクチャに加えて、スキーマ定義を正確にモデルに伝える「グラウンディング」手法が公開されています。
公開されたスキーマ・グラウンディングのパターンは、テーブル定義・カラム型・外部キー関係をモデルに正確に伝える実装方法を示しています。Gemini を使っていない場合でも、このパターンは他のモデルの Text-to-SQL 精度向上に応用できる可能性があります。
BI ダッシュボードへの
LLM 組み込みが現実的に
80% の精度は「まだ完全ではない」ものの、標準的な BI・分析クエリの多くをカバーできる水準です。Snowflake や Databricks 等の中間ツールを挟まず Google 純正で Text-to-SQL を完結したい組織には選択肢が広がります。残り 20% の誤りに対する人間レビューの仕組みを設計すれば、今すぐ部分的な導入を検討できます。