FT-RAG:複雑な表の推論のためのきめ細かなリトリーバル拡張生成フレームワーク

arXiv cs.CL / 2026/5/5

📰 ニュースDeveloper Stack & InfrastructureModels & Research

要点

  • この論文では、従来のRAGが苦手とする複雑な表の推論領域でLLMの性能を高めるための、きめ細かなリトリーバル拡張生成フレームワーク「FT-RAG」を提案している。
  • FT-RAGは、表をエントリ単位の意味表現に分解して構造化グラフを構築し、構造的な近傍拡張によってグラフ検索を行ったうえで、表検索結果の文脈を統合するためのマルチモーダル融合を用いる。
  • データセット不足への対応として、Multi-Table-RAG-Libというベンチマークを公開しており、9,870件の高難度・高複雑度のQAペアを収録し、多表統合とテキスト×表の情報融合を要する設計になっている。
  • 実験では、表レベルおよびセルレベルのHit Rate(それぞれ23.5%と59.2%)や、完全一致の値精度におけるリコール(62.2%増)など、既存の強力なベースラインに対する大きな改善が報告されており、純粋な表と混在する表×テキストの両方で事実に基づく根拠付けが向上したことが示されている。

概要: 取得拡張生成(Retrieval-Augmented Generation: RAG)は、推論時に外部知識にもとづいて応答を根拠づけることで、大規模言語モデル(LLM)を強化します。しかし、従来のRAGシステムは、主として検索の粒度が粗いことや、表の意味理解が不十分であることに起因して、構造化された表形式データに対しては十分な性能を発揮できません。これらの制約に対処するために、表をエントリレベルの意味単位へ分解して構造化されたグラフを構築することで、知識の関連付けを行う微細粒度フレームワークFT-RAGを提案します。FT-RAGでは、グラフ探索(graph retrieval)中に意味的に連結した実体を見つけるための構造的近傍拡張メカニズムを用い、その後にマルチモーダル融合を行って、表探索結果の文脈を統合します。さらに、この領域における専門データセットの不足に対処するために、Multi-Table-RAG-Libというベンチマークを導入します。これは、複数表の統合と、推論のためのテキスト-表情報の融合を要求するようにキュレーションされた、高い複雑性と難易度を持つ9870件のQAペアから構成されます。FT-RAGは、すべての指標において最高性能のベースラインを上回り、表レベルおよびセルレベルのHit Rateにそれぞれ23.5%および59.2%の改善を達成します。生成性能においても、厳密値の精度に関する再現率(exact value accuracy recall)が62.2%増加するという顕著な改善が見られます。これらの指標は、純粋な表形式コンテキストおよび異種(テーブル-テキスト)コンテキストの双方において、事実根拠づけ(factual grounding)に対する本フレームワークの有効性を裏付けます。したがって、本手法は、混合モダリティ文書に対する複雑な推論において新たな最先端性能を確立します。