KG-Hopper:強化学習による知識グラフ推論でコンパクトなオープンLLMを強化する
arXiv cs.CL / 2026/3/24
📰 ニュースSignals & Early TrendsIdeas & Deep AnalysisModels & Research
要点
- 本論文では、知識グラフのマルチホップ質問応答において、脆い手順ごとのパイプラインを削減することでコンパクトなオープンLLMを改善するための、強化学習フレームワークであるKG-Hopperを提案する。
- 推論を孤立した逐次ステップとして実行する代わりに、KG-Hopperは7Bの「Reasoning LLM」を学習させ、知識グラフ探索と意思決定の全過程を、動的な経路探索とバックトラックを伴う単一の統合された思考ステージに埋め込む。
- 8つのKG推論ベンチマークにわたる実験により、KG-Hopperはより大規模なマルチステップシステム(最大70B)を上回り、GPT-3.5-TurboやGPT-4o-miniといったプロプライエタリなモデルに対して競争力のある性能に匹敵することが示される。
- 本手法はコンパクトでオープンであり、データ効率も高いと報告されており、著者らはリンクされたGitHubリポジトリを通じて公開コードを提供している。
