EHRAG:ハイブリッドなハイパーグラフ構築とリトリーバルで軽量GraphRAGのセマンティックギャップを埋める

arXiv cs.AI / 2026/4/21

📰 ニュースDeveloper Stack & InfrastructureModels & Research

要点

  • この論文では、EHRAGという軽量GraphRAGフレームワークを提案し、構造的な共起だけでは生まれる「セマンティックギャップ」を埋めることを目指します。
  • EHRAGはハイパーグラフを、構造(文レベルのエンティティ共起と軽量抽出に基づく構造ハイパーエッジ)と意味(エンティティ文テキスト埋め込みのクラスタリングに基づく意味ハイパーエッジ)の両面から構築し、潜在的な関係を捉えます。
  • 取得(リトリーバル)では、構造と意味のハイブリッド拡散にトピックを考慮したスコアリングと、パーソナライズドPageRank(PPR)による精緻化を組み合わせて、関連度の高い上位k文書を選びます。
  • 4つのデータセットでの実験により、EHRAGは既存のベースラインを上回る性能を示しつつ、インデックス作成の計算量が線形で、ハイパーグラフ構築にトークン消費ゼロであることが示されています。
  • GitHub上でコードが公開されており、再現性の検証や発展的な研究に活用できます。