FD-NL2SQL:利用に応じて改善するフィードバック駆動型の臨床NL2SQL

arXiv cs.CL / 2026/4/20

📰 ニュースSignals & Early TrendsTools & Practical UsageModels & Research

要点

  • FD-NL2SQLは、SQLiteベースの腫瘍領域の試験データベース向けに設計された、フィードバック駆動の臨床NL2SQLアシスタントであり、スキーマに詳しくなくても多条件のSQL作成を支援します。
  • 仕組みとしては、スキーマを考慮したLLMが自然言語の質問を述語レベルのサブ質問に分解し、意味的に類似した専門家が検証したNL2SQLの例(エグザンプル)を検索して、妥当性チェック付きで実行可能なSQLを合成します。
  • 改善は利用後も続き、生成SQLへの医師の承認済み編集をエグザンプルバンクに追加するほか、軽量な論理ベースのSQL拡張(単一の原子操作の変異)を行い、結果が空でない場合のみバリアントを保持します。
  • 採用された変異(編集・拡張)について、別のLLMが対応する自然言語の質問と述語分解を自動生成し、追加の手作業アノテーションなしでエグザンプルバンクを拡張します。
  • デモでは、分解・検索・合成・実行の結果をユーザーに可視化し、対話的な修正と継続的な改善を促すインターフェースを提供します。

Abstract

がん治療の試験リポジトリを探索する臨床医は、バイオマーカー、エンドポイント、介入、時間にまたがるアドホックな複数制約クエリをしばしば必要としますが、SQLを書くにはスキーマに関する専門知識が要求されます。私たちは、SQLite ベースのがんデータベース向けの、フィードバック駆動型の臨床 NL2SQL アシスタントである FD-NL2SQL をデモします。自然言語の質問が与えられると、スキーマを意識する LLM がそれを述語レベルのサブ質問へと分解し、文埋め込みによって意味的に類似した、専門家によって検証済みの NL2SQL の例を取得し、さらにその分解、取得した例、スキーマに条件付けられて、実行可能な SQL を合成します。加えて、事後処理として妥当性チェックを行います。運用を通じて改善するために、FD-NL2SQL は 2 つの更新シグナルを組み込みます:(i)生成された SQL に対する臨床医の編集が承認されると、その SQL が例示バンクに追加されること、そして(ii)軽量な論理ベースの SQL 拡張が単一の原子ミューテーション(例:演算子や列の変更)を適用し、非空の結果を返す場合に限ってバリアントを保持することです。2 つ目の LLM は、受け入れられたバリアントに対応する自然言語の質問と述語分解を生成し、追加のアノテーションなしで例示バンクを自動的に拡張します。デモ用のインターフェースは、分解、取得、合成、実行結果を表示し、対話的な改善と継続的な向上を支援します。