PV-SQL:テキスト→SQLエージェントにおけるデータベース探索とルールベース検証の相乗効果

arXiv cs.AI / 2026/4/21

📰 ニュースIdeas & Deep AnalysisModels & Research

要点

  • PV-SQLは、複雑なクエリで深い文脈理解が必要な場合における性能向上を目的とした、新しいエージェント型テキスト→SQLフレームワークである。
  • そのアプローチは2要素から成り、Probeは探索用のクエリを反復的に生成してデータベース上の具体的なレコードを取得し、値の曖昧さ、列の意味、テーブル間の関係を明確化する。
  • Verifyはルールベースで検証可能な条件を抽出し、実行可能なチェックリストを構築して、SQLの反復的な改良を効果的に導く。
  • BIRDベンチマークでPV-SQLは、最良のテキスト→SQLベースラインに対して実行精度を5%向上させ、valid efficiencyを20.8%改善しつつ、使用トークン数はより少ない。

要旨: テキスト・ツー・SQLシステムは、特に微妙な要件を伴う複雑なクエリにおいて、深い文脈理解にしばしば苦労します。そこで本研究では、Probe(プローブ)とVerify(検証)の2つの補完的コンポーネントによってこれらの失敗に対処する、エージェント型フレームワークであるPV-SQLを提案します。Probeコンポーネントは、データベースから具体的なレコードを取得するためのプロービングクエリを反復的に生成し、値の形式、列の意味論、テーブル間の関係における曖昧さを解消して、より豊かな文脈理解を構築します。Verifyコンポーネントは、検証可能な条件を抽出し、実行可能なチェックリストを構築するためにルールベースの手法を用い、欠落する制約を効果的に減らす反復的なSQL洗練を可能にします。BIRDベンチマークでの実験では、PV-SQLは最良のテキスト・ツー・SQLベースラインに比べ、実行精度で5%上回り、有効効率スコアで20.8%上回ることが示され、かつ使用トークン数も少なくなります。