Abstract
クイズの設計は、教師が、生徒による知識の習得状況を評価するために行う、手間のかかる作業です。本論文の目的は、複数選択式問題(MCQ)の集合からクイズ構成を自動化することです。私たちは、所望のトピック網羅度と難易度の水準を満たすクイズを作成するようエージェントを訓練することを目的として、汎用的な逐次意思決定問題を定式化します。私たちは、本問題を解くための3つの強化学習ソリューションであるDQN、SARSA、A2C/A3Cを調査します。私たちは、RLが最良のクイズに到達できる能力を検討する、合成データセットと実データセットの両方に対して大規模な実験を行いました。その結果、エージェントの行動の微妙な違い、および異なるデータ分布と教師の目標による転移学習の違いが明らかになりました。これらはユーザースタディによって裏付けられており、さまざまな教師の教育的目標の自動化への道を開くものとなっています。