MEDLEY-BENCH:AIメタ認知における評価は買うが制御は買わない
arXiv cs.AI / 2026/4/20
📰 ニュースIdeas & Deep AnalysisModels & Research
要点
- 本研究では、独立した推論・私的な自己修正・モデル間の本物の意見相違に伴う社会的影響下での修正を切り分ける、行動ベースのメタ認知ベンチマーク「MEDLEY-BENCH」を提案している。
- MEDLEY-BENCHは、5つの領域で合計130の曖昧なケースに対して12のモデル系統から35モデルを評価し、MMS(反省的アップデート、社会的頑健性、認識論的明確化)とMAS(メタ認知サブ能力4つ)という2つの補完的スコアを報告する。
- 結果として、評価と制御の間に堅牢な解離が見られ、モデル系統内では評価能力がモデル規模とともに向上する一方、制御(修正の運用)は同様にスケールしないことが示される。
- 11モデルを対象にした逐次的な対向者解析では、「議論の質に基づいて主に修正する」タイプと「合意形成の統計に沿って修正する」タイプの2つの行動プロファイルが観測される。
- ipsativeスコアリングでは全35モデルで評価が相対的に最も弱い能力であることが明らかになり、メタ認知における“知っているのに実行できない(knowing/doing gap)”という体系的なギャップが示唆される。



