AIはティーチングパートナーになり得るか?3つの教授戦略においてChatGPT、Gemini、DeepSeekを評価する
arXiv cs.AI / 2026/3/31
💬 オピニオンIdeas & Deep AnalysisModels & Research
要点
- 本研究では、初心者のCプログラミング学習者を対象とした3つの教授法(Examples、Explanations & Analogies、Socratic Method)に焦点を当てた評価プロトコルを用い、「教授エージェント」としてChatGPT、Gemini、DeepSeekを比較する。
- ExamplesおよびExplanations/Analogiesにおいて、モデルはいずれも概ね同様の対話パターンを示しており、これらの教授アプローチに対して同程度の有効性があることを示唆する。
- Socratic Methodでは、モデルの振る舞いが選択した戦略と最初のプロンプトの両方に対してより敏感になり、注意深いプロンプト設計なしでは一貫性の低いパフォーマンスになることが示される。
- 人間の評価者は全体としてChatGPTとGeminiに高い評価を付け、DeepSeekは評価基準全体で低いスコアであった。これは、LLM間で教授的な質に測定可能な差があることを反映している。
- 本論文は、AIチュータリングに関する一般的主張に頼るのではなく、体系的な人間評価を用いることで、LLMの教授スキルに関する実証的エビデンスの不足に取り組む。



