検索しないでナビゲート：QAとRAGのために企業ナレッジをナビゲート可能なエージェントスキルへ蒸留する

arXiv cs.CL / 2026/4/17

💬 オピニオンIdeas & Deep AnalysisTools & Practical UsageModels & Research

共有:

要点

従来のRAGは、LLMがコーパス構造や未取得の情報を理解できず、受動的に検索結果を消費するだけだという点が制約になると論じています。
提案手法のCorpus2Skillは、文書コーパスをクラスタリングと階層ごとのLLM要約を用いて、オフラインで「ナビゲート可能なスキルディレクトリ（階層ツリー）」へ蒸留します。
提供（サービング）時には、エージェントが階層を俯瞰し、要約を段階的に細かくしながらトピックの枝を掘り下げ、IDで全文文書を取得します。
階層が明示されていることで、無駄な経路からのバックトラックや、異なる枝にまたがる根拠の統合が可能になります。
WixQAの実験では、Corpus2Skillが密検索、RAPTOR、エージェント型RAGのベースラインを、評価した品質指標すべてで上回ることが示されています。

要旨: リトリーバル拡張生成（RAG）は、LLMの応答を外部の根拠に基づけますが、モデルを検索結果の受け身の消費者として扱います。すなわち、コーパスがどのように整理されているのか、またまだ取得していないものが何かをモデルは一切見ないため、行き詰まりからの巻き戻しや、散在する根拠の組み合わせが難しくなります。私たちは Corpus2Skill を提案します。これは文書コーパスを階層的なスキルディレクトリへオフラインで蒸留し、提供時（serve time）にLLMエージェントがそれをナビゲートできるようにします。コンパイル手順は反復的に文書をクラスタリングし、各レベルでLLMが書いた要約を生成し、結果をナビゲート可能なスキルファイルのツリーとして具現化します。提供時には、エージェントがコーパスの俯瞰的な見取り図を受け取り、より細かな要約を段階的に用いながらトピック分岐へ深掘りし、IDによって完全な文書を取得します。階層が明示的に可視化されているため、エージェントはどこを見るべきかを推論でき、成果の得られない経路から巻き戻して、分岐間の根拠を組み合わせることができます。RAGのエンタープライズ向けカスタマーサポート評価ベンチマークであるWixQAにおいて、Corpus2Skill は、全ての品質指標において、密な検索（dense retrieval）、RAPTOR、エージェント型RAGのベースラインを上回ります。