MEG-RAG:RAGにおける証拠選択のためのマルチモーダル・エビデンス・グラウンディングを定量化する

arXiv cs.CL / 2026/4/28

📰 ニュースModels & Research

要点

  • MEG-RAGは、マルチモーダルRAG(MRAG)で、取得したマルチモーダル情報が回答の意味的中核を本当に裏付けているかをより適切に見極めることで課題を解決しようとします。
  • 本論文では、Multi-modal Evidence Grounding(MEG)という、情報量の大きいトークン(高IDF)に基づく「Semantic Certainty Anchoring」を用いて取得証拠の寄与を見積もるセマンティック重視の指標を提案します。
  • MEGに基づき、MEG-RAGは正解データのセマンティックアンカーに取得証拠を整合させるようマルチモーダル再ランカーを学習し、トークン確率の分布ではなく意味的根拠に基づいて価値の高い内容を優先します。
  • M$^2$RAGベンチマークでの実験では、MEG-RAGが強力なベースラインを一貫して上回り、異なる教師モデル間でも頑健に汎化することが示されています。
  • まとめると、本研究は新しい定量化指標(MEG)と、それに対応する学習フレームワーク(MEG-RAG)を通じて、ハルシネーションの抑制と生成のマルチモーダル整合性向上を狙っています。