推論構成要素の分類のための共同マルチタスク学習による科学教室の対話分析の強化

arXiv cs.CL / 2026/4/24

📰 ニュースTools & Practical UsageModels & Research

共有:

要点

この論文は、教師と生徒の発話を対象に「発話タイプ」と「推論構成要素」の2軸で同時に分類することで、科学教室の対話を自動分析するADASを提案している。
ラベルの強い不均衡に対処するため、著者らはデータセットの層化リスプリット、少数クラスに焦点を当てたLLMベースの合成データ拡張、そしてデュアルプローブのRoBERTa-base分類器を用いる。
ゼロショットGPT-5.4の結果として、マクロF1が発話タイプ（UT）で約0.47、推論構成要素（RC）で0.476に到達し、プロンプトのみの手法に対する上限として提示されている。
分類に加えて、UTxRCの共起分析、セッションごとの認知的複雑性指数（CCI）、ラグ順次分析、IRFチェーン分析などを行い、教師の「Feedback-with-Question（Fq）」が生徒の推論的推論（SR-I）の最も一貫した先行要因であることを示している。
結果として、LLMによる合成拡張がUTの少数クラス認識を改善し、RC課題は構造が単純なため語彙ベースラインでも比較的取り組みやすいことが示唆されている。