10年スパンの“綱引き”:教師ガイド付きRAGによる脆弱性分析における競合解決

arXiv cs.CL / 2026/4/17

📰 ニュースDeveloper Stack & InfrastructureModels & Research

要点

  • 論文は、CVEなどの脆弱性情報が更新され続けることで知識の不一致や競合が生じ、LLMによる脆弱性分析で事実誤認や幻覚(ハルシネーション)につながり得ると主張しています。
  • その解決として、CRVA-TGRAGという2段階フレームワークを提案し、CVE文書の検索改善と生成時のLLM微調整を組み合わせています。
  • 検索段階では、Parent Document Segmentationと、意味類似度検索と転置インデックスを組み合わせたアンサンブル手法を用いて、最新のCVE知識をより適切に見つけることを狙います。
  • 生成段階では、CVEデータセットの検索結果をもとに教師ガイド付きの選好最適化でLLMを微調整し、より正確で精緻な回答を生成することを目指します。
  • 実験では、外部知識ベースだけを使う場合と比べて最新CVEの取得精度が向上し、LLMの内部知識のみに依存する場合に起き得る知識競合を抑えられることが示されています。

10年スパンの“綱引き”:教師ガイド付きRAGによる脆弱性分析における競合解決 | AI Navigate