フラットから構造へ:GraphRAGで自動短答評価を強化する
arXiv cs.AI / 2026/3/23
📰 ニュースIdeas & Deep AnalysisModels & Research
要点
- LLMsは自動短答評価(ASAG)における幻覚と厳格なルーブリックの遵守の課題に直面しており、標準のフラットRAG検索は重要な構造的依存関係やマルチホップ推論を見逃してしまう。
- GraphRAGフレームワークは、概念間の依存関係を明示的にモデル化する構造化知識グラフを導入し、より整合的で包括的なエビデンス検索を可能にする。
- このアプローチは、高忠実度のグラフ構築のための Microsoft GraphRAG と、連想的なグラフ走査を実行する HippoRAG ニューロシンボリックアルゴリズムを組み合わせた二段階パイプラインを採用します。
- NGSSデータセット上の実験結果は、GraphRAGが標準的なRAGベースラインを指標全体で大きく上回り、特にScience and Engineering Practices(SEP)の評価で顕著な改善を示した。
