価値を考慮した介入による人間のパフォーマンス向上:チェスにおける事例研究
arXiv cs.AI / 2026/4/17
📰 ニュースIdeas & Deep AnalysisModels & Research
要点
- 本論文は、AIアシスタントが人間の行動に介入すべき「タイミング」と「方法」を決めるという、AI支援の逐次意思決定における重要な課題に取り組んでいます。
- 強化学習の原理に基づく「価値を考慮した介入(value-aware interventions)」を提案し、人間の(部分的に)最適でない方策が取る行動と、次状態の価値を含めて即時報酬最大化に対応する行動との不一致が、介入の機会を自然に示すことを示します。
- 介入をMDP(マルコフ決定過程)として定式化し、介入予算の下で最適単回介入戦略と、複数介入向けの近似手法(方策価値の不一致の大きさで優先順位付け)を導きます。
- チェスで検証し、大規模な対局データから学習した人間モデルを用いて、最強チェスエンジン(Stockfish)に基づく介入よりも幅広い設定で一貫して優れた性能を示します。
- 20人の被験者・600ゲームによる被験者内研究では、提案介入が低〜中スキル層の成績を有意に改善し、高スキル層ではエキスパートエンジン介入と同等の結果になることが分かります。