コード依存関係による構造に基づく知識検索を用いた多段階データ推論
arXiv cs.CL / 2026/4/14
💬 オピニオンSignals & Early TrendsIdeas & Deep AnalysisModels & Research
要点
- 本論文は、検索拡張型LLMのアプローチがしばしば語彙・埋め込みの類似度に基づいており、多段階データ推論に実際に必要となる知識の代理としては不適切になり得ると主張する。
- 関数呼び出し関係に基づいて、テキスト類似度だけではなく領域知識の依存グラフを構築することで、SGKR(Structure-Grounded Knowledge Retrieval)を提案する。
- 与えられた問いに対して、SGKRは意味的な入出力タグを導出し、それらを結ぶ依存パスを見つけ、そのタスクに関連する部分グラフと、対応する関数実装を組み立てて、LLMによるコード生成のための構造化コンテキストとする。
- 多段階データ分析のベンチマークに対する実験により、SGKRは、検索なしおよび類似度ベースの検索手法と比べて、素のLLMとコーディングエージェントのいずれにおいても解の正しさを改善することが示される。




