レコメンドシステムにおけるクリエイターのインセンティブ:マルチエージェント・バンディットにおける安定的で公正な協調のための協力的ゲーム理論アプローチ
arXiv cs.LG / 2026/4/13
💬 オピニオンSignals & Early TrendsIdeas & Deep AnalysisModels & Research
要点
- 本論文は、ユーザのフィードバックを、移転可能効用(TU)をもつ協力ゲームの枠組みとして、複数のコンテンツクリエイター間のインセンティブ設計を、マルチエージェント確率的線形バンディットとしてモデル化することで研究する。
- 同一(ホモジニアス)なエージェントで行動集合が固定されている場合、著者らは、軽微な条件のもとで得られるTUゲームが凸であることを示し、安定性と公正性を提供するために、非空のコアを保証し、そのコアにはシャープレイ値が含まれることを示す。
- 異質(ヘテロジニアス)なエージェントの場合でもゲームのコアは非空であるが、凸性やシャープレイ値がコアのメンバーであることはもはや保証されない。これにより、別の支払い(パイアウト)メカニズムが動機づけられる。
- 著者らは、コアに属し、シャープレイの公理の4つのうち3つを満たす、後悔(regret)に基づく支払いルールを導入し、より一般的な設定において公正な協調を実現することを目指す。
- MovieLens-100kに関する実験では、実証的な支払いがシャープレイに基づく公正性と一致する条件、ならびに異なる環境や学習アルゴリズムのもとで支払いがどのように乖離するかを分析する。

