GraphWalker：合成軌跡カリキュラムによるエージェント型知識グラフ質問応答

arXiv cs.CL / 2026/3/31

📰 ニュースIdeas & Deep AnalysisModels & Research

共有:

要点

本論文は、学習データが限られている状況でも探索と推論の汎化性能を向上させることを目的とした、エージェント型の知識グラフ質問応答フレームワークであるGraphWalkerを提案する。
制約付きランダムウォークによる自動軌跡合成を用いて探索の事前分布を学習し、その後、専門家軌跡に対して段階的な微調整を行うことで、反省（reflection）とエラー回復を教える。
実験結果により、GraphWalkerはCWQおよびWebQSPにおいて最先端の性能を達成し、続く軽量な強化学習段階により高い性能上限が得られることが寄与していることが示される。
GrailQAに対する追加評価と、新たに構築したGraphWalkerBenchにより、分布外の推論パスへの一般化が改善されることが示される。

概要: エージェント型の知識グラフ質問応答（KGQA）では、エージェントが知識グラフ（KG）と反復的に相互作用する必要があり、訓練データの不足と推論の汎化の難しさの両方が課題となる。具体的には、既存の手法では多くの場合、エージェントの探索を制限している。プロンプトベースの方法は自律的なナビゲーションの訓練を欠いており、一方で現在の訓練パイプラインでは推論を通常あらかじめ定義された軌道に閉じ込めている。そこで本論文では、これらの課題に対処する extit{GraphWalker} という新しいエージェント型KGQAフレームワークを提案する。本手法は extit{Automated Trajectory Synthesis（自動軌道合成）} と extit{Stage-wise Fine-tuning（段階的ファインチューニング）} によって課題を解決する。GraphWalker は二段階のSFT訓練パラダイムを採用する。第一に、エージェントは、制約付きランダムウォーク経路から合成された構造的に多様な軌道上で訓練され、KGに対する広い探索の事前分布を確立する。第二に、エージェントを少数の専門家による軌道データでさらにファインチューニングし、内省とエラー回復の能力を獲得させる。大規模な実験により、我々の段階的SFTパラダイムが、軽量な強化学習（RL）段階におけるより高い性能の上限を解放することを示す。これにより、GraphWalker は CWQ および WebQSP において最先端の性能を達成する。GrailQA と、我々が構築した GraphWalkerBench に関する追加結果も、GraphWalker が分布外の推論経路への汎化を向上させることを確認している。コードは https://github.com/XuShuwenn/GraphWalker で公開されている。