報酬によるスカウティング:VLM-TO-IRLを用いたeスポーツの選手選抜
arXiv cs.LG / 2026/4/17
📰 ニュースDeveloper Stack & InfrastructureModels & Research
要点
- 本論文は、eスポーツの選手スカウティングを、集計的な成績指標だけでは捉えにくい微妙な戦術的意思決定パターンを反映するために、逆強化学習(IRL)問題として再定義することを提案している。
- ログ化された対戦デモからプロ選手ごとの報酬関数を学習し、特定のスター選手との「スタイルの一致度」に基づいて候補者をランキングする選手選抜フレームワークを提示している。
- アーキテクチャはマルチモーダルな2枝入力を用い、1つは高解像度のゲーム内テレメトリから得る構造化された状態-行動の軌跡、もう1つは放送映像からVLM(Vision-Language Model)が生成した時間整合のある戦術的疑似コメントをエンコードする。
- Generative Adversarial Imitation Learning(GAIL)の目的により、識別器がエリート選手の特徴的なメカニクスと戦術的シグネチャを学習して候補を評価する。
- この手法は、非常に大規模な候補プールに対しても、データ駆動でロスターを構築し、狙いを定めた才能発掘を行える「ワークフロー対応型デジタルツイン」を目指している。



