要旨: 大規模言語モデル(LLMs)の急速な発展に伴い、LLMベースの表検索に対する取り組みが高まっています。しかし、既存の研究は通常、単一テーブルのクエリに焦点を当て、全表をエンコードした後の類似度マッチングによって実装します。これらの方法は、クエリに関連しないデータを多く含む粗粒度のエンコードのため、精度が低くなることが多く、表が大きい場合には非効率で、LLMの推論能力を十分に活用できません。さらに、マルチテーブルクエリは検索タスクで十分に探索されていません。これを受けて、私たちはLLMに基づく階層的なマルチテーブルクエリ手法 FGTR(Fine-Grained Multi-Table Retrieval)を提案します。人間のような推論戦略を用いる新しい検索パラダイムです。階層的推論を通じて、FGTRはまず関連するスキーマ要素を特定し、その後対応するセル内容を取得し、最終的に与えられたクエリに整合する簡潔で正確なサブテーブルを構築します。FGTRの性能を総合的に評価するために、SpiderとBIRDに基づく2つの新しいベンチマークデータセットを構築します。実験結果は、FGTRが従来の最先端手法を上回り、SpiderでF_2指標を18%、BIRDで21%改善することを示しており、細粒度検索の強化と表ベースの下流タスクにおけるエンドツーエンドの性能改善の可能性を示しています。
FGTR: 階層的LLM推論による細粒度のマルチテーブル検索
arXiv cs.CL / 2026/3/16
💬 オピニオンModels & Research
要点
- FGTRは、LLMベースのタスクのための階層的で細粒度なマルチテーブル検索手法を導入し、単一テーブルアプローチの粗いエンコーディングとスケーラビリティの制約に対処する。
- 手法はまず関連するスキーマ要素を特定し、次に対応するセルの内容を取得して、クエリに整合した簡潔なサブテーブルを構築する。
- SpiderおよびBIRDベンチマークでの実験は、F2指標において従来の最先端手法より顕著な改善を示す(Spiderで18%、BIRDで21%)。
- このアプローチは、複数のテーブルにまたがるより正確で細粒度な検索を実現することで、テーブルベースの下流タスクのエンドツーエンド性能を向上させる可能性を示している。