LAPITHSで「センタウロス」を飼いならす:AIパフォーマンスの理論的に根拠づけられた解釈のためのフレームワーク
arXiv cs.AI / 2026/5/1
💬 オピニオンIdeas & Deep AnalysisModels & Research
要点
- 本論文は、人間らしさに関するAIの主張を評価するための、AIパフォーマンスの理論的に根拠づけられた解釈の枠組み「LAPITHS」を提案する。
- LAPITHSを用いて、CENTAUR(認知の人工統一モデル)として提示されたモデルに関連する主要な主張のいくつかが、理論的・実証的に裏づけられていないと著者は主張する。
- 研究上の「行動主義的な傾向」を問題視し、トランスフォーマー系言語モデルの性能を、人間に似た基盤計算や認知能力の証拠として見なす解釈に警鐘を鳴らしている。
- LAPITHSは、理論的に動機づけられた「Minimal Cognitive Grid(最小認知グリッド)」による認知尤度推定と、認知的妥当性に結びつく構造制約を満たさない別システムでも同様の挙動が再現できることを示す行動比較の2つの定量的要素で構成される。
- 著者らは、CENTAURのようなシステムで観察される振る舞いの一部は、人間の認知を独立に説明するものではなく、認知的に妥当性が低い別システムでも再現可能だと結論づける。




