EGREFINE:テキストからSQLへのスキーマ精錬のための実行に基づく最適化フレームワーク
arXiv cs.CL / 2026/5/4
💬 オピニオンIdeas & Deep AnalysisModels & Research
要点
- 本論文は、Text-to-SQLの精度を向上させるために、生成後のエラー修正だけでなく、曖昧・不統一な列名などのデータベース・スキーマ名を精錬するEGREFINEを提案している。
- スキーマ精錬を、データベースビューを用いてクエリ同値性を保ちつつ下流のText-to-SQL実行精度を最大化する制約付き最適化問題として定式化している。
- EGRefineは、(1)曖昧な列のスクリーニング、(2)文脈に基づく候補名生成、(3)実行に基づくフィードバックによる検証、(4)非破壊的なSQLビューへのマテリアライズ、という4段階のパイプラインで構成される。
- 保証として、検証フェーズの保守的な選択則により列単位の非劣化を、ビューによるマテリアライズによりデータベース単位のクエリ同値性をそれぞれ担保している。
- 実験では、可能な場合にスキーマ名ノイズによって失われた精度を回復し、タスクが現状のText-to-SQL能力を超える場合には適切に“見送る”ことを示し、さらに複数のモデル系統へも転移して「refine-once, serve-many」を実現している; コードとデータは公開されている。



