グラフ上のバンディットと構造

arXiv cs.LG / 2026/5/6

💬 オピニオンIdeas & Deep AnalysisModels & Research

要点

  • 本論文は、逐次的な意思決定問題の構造的性質を調べることで、解法を実用に近づけることを目的としています。
  • アクションをグラフとして表現できる構造に重点を置き、グラフ・バンディットを報酬の滑らかさ(スペクトラル・バンディット)、サイド観測、影響最大化の設定で研究します。
  • カーネル・バンディットやポリマトロイド・バンディットなど、非常に大きい構造化領域まで対象を広げ、滑らかさが未知の場合を含む関数最適化のためのバンディットも扱います。
  • アクション空間が基底アクション数に対して指数的、あるいは無限大になり得る状況として、無限個アームのバンディットも取り上げます。
  • 全体として、本研究はグラフ型および構造化バンディットに関する著者の貢献をまとめたサーベイを志向しています。

要旨: 本論文の目的は、特定の逐次問題の構造的性質を調査し、解を実用的な利用により近づけることにある。前半では、行動上のグラフとして表現可能な構造に特別な重点を置く。後半では、基底となる行動の数に関して指数関数的な大きさ、あるいは無限にもなり得る大規模な行動空間を扱う。グラフ・バンディットにおいては、報酬の滑らかさ(スペクトル・バンディット)、側方観測、そして影響力の最大化の設定を考える。大規模な構造化領域では、カーネル・バンディット、ポリマトロイド・バンディット、関数最適化のためのバンディット(未知の滑らかさを含む)、および無限に多い腕のバンディットを取り上げる。本論文は、著者によるグラフおよび構造化バンディットに関する貢献についてのサーベイであることを目指している。