CODE-GEN:複数選択式の問題生成のための、ヒューマン・イン・ザ・ループ型RAGベースのエージェント型AIシステム
arXiv cs.AI / 2026/4/7
💬 オピニオンSignals & Early TrendsIdeas & Deep AnalysisModels & Research
要点
- CODE-GENは、人の介在(human-in-the-loop)と検索拡張(RAG)を組み合わせたエージェント型AIシステムとして導入されており、コースの学習目標に結び付く、文脈に整合した複数選択式のコーディング理解問題を生成することを目的とする。
- このシステムは、2つの連携エージェント—問題を下書きするGeneratorと、7つの教育学的次元にわたって内容の質を独立に評価するValidator—を用い、計算上の正確性やコード検証を支援する専門ツールを併用する。
- 6名の領域専門家による評価では、AIが生成した288問をレビューし、2,016件の人間—AIの評価比較と、追加の定性的フィードバックが得られた。
- 結果は良好であり、多くの次元において、明示的な基準および計算チェックに整合した人間検証済みの成功率が79.9%〜98.6%と高いことが示された。
- 本研究では、意味のあるもっともらしい選択肢(紛らわしい選択肢)の作成や、理解を深めるフィードバックの記述といった、より難しい教育学的タスクにおいては、人間の専門知識が依然として重要であることが分かった。




