要旨: 認知科学および人工知能における研究では、複数の個人間の相互作用の痕跡に学習エージェントを触れさせることが、さまざまな状況で性能を向上させ得ることが示唆されている。しかし、どの相互作用の特徴がこの改善に寄与するのかは、いまだ不明である。私たちは、相互作用データの有効性を支える要因を調べた。具体的には、相互作用と、専門家が単独で行動することとの間の重要な違いを、厳密に操作化できる制御されたパラダイムを用いた。そこで、空間ナビゲーション課題において、専門家と初心者の間で生じる単純な相互作用の合成データセットを作成し、そのデータセットでトランスフォーマーモデルを訓練した。そして、異なるデータセットに触れた後の性能を評価した。実験の結果、教育的(pedagogical)な相互作用にもとづいて訓練されたモデルは、専門家のデモンストレーションのみで訓練されたモデルよりも、さまざまなシナリオにわたって頑健であることが示された。また、認識論的に異なるエージェントを表現できることにより、専門家の振る舞いがほとんど観測されない状況であっても、専門家に近い振る舞いが可能になることが分かった。
専門性の表現が、教育的相互作用データからの学習を加速する
arXiv cs.CL / 2026/4/15
💬 オピニオンSignals & Early TrendsIdeas & Deep AnalysisModels & Research
要点
- 本論文は、初心者と専門家の間の相互作用トレースが学習をどのように改善し得るのか、その理由を調べ、得られる効果を生み出す相互作用の特徴が、専門家のみのデモンストレーションと比べて何に依存するのかに焦点を当てる。
- 制御された空間ナビゲーションのパラダイムを用い、教育的(専門家–初心者)相互作用と専門家のみの行動からなる合成データセットを生成する。
- 教育的相互作用データで学習したトランスフォーマーモデルは、専門家のみのデモンストレーションで学習したモデルを上回り、さまざまなシナリオにまたがってもより頑健である。
- 本研究ではさらに、エピステミックに異なるエージェントを明示的に表現することで、データ中で専門家の行動が頻繁に現れなくても、専門家のようなふるまいを可能にすることを見出す。




