MAB-DQA:マルチアームバンディットによる文書質問応答におけるクエリ側のアスペクト重要度への対処

arXiv cs.CL / 2026/4/13

📰 ニュースSignals & Early TrendsIdeas & Deep AnalysisModels & Research

要点

  • 本論文は、ページ画像に対するマルチモーダルRAGがしばしば小さなtop-K集合のみを取得してしまい、有用だが視覚的に目立ちにくいページを見落とすという問題に対処する、マルチモーダル文書質問応答を対象とする。
  • MAB-DQAは、クエリをアスペクトに応じて分解したサブクエリとして扱い、各サブクエリに対してアスペクト固有の候補集合を取得する。
  • MAB-DQAはマルチアームバンディット戦略を用い、各アスペクトサブクエリを「腕」として扱い、限られた代表ページに対する推論から得られる報酬によりアスペクトの有用性を推定する。
  • 探索–活用(exploration–exploitation)ポリシーにより、価値の高いアスペクトへと取得予算を動的に再配分し、情報性のあるページとそれらの相関を用いて最終的な期待回答を生成する。
  • 4つのベンチマークでの実験により、先行の最先端ベースラインに対して平均5%〜18%の改善が示され、著者らはGitHubでコードを公開している。