暗記を超えて:古典論理パズルを用いたLLMにおける還元的推論と認識論的推論の識別
arXiv cs.CL / 2026/3/24
💬 オピニオンIdeas & Deep AnalysisModels & Research
要点
- 本論文は、認識論的論理パズルに対するLLMの従来の評価が、モデルのふるまいを「認識論的推論」か「脆い暗記」のいずれかに単純化しすぎていたと主張する。
- 論文は、暗記を一種の還元的推論として捉え直す。すなわち、新しいパズルの実例を、過去に知られた代表的な(canonical)問題へと対応付けるのである。
- 著者らは「リダクション・ラダー(reduction ladder)」を導入する。これは、核となる論理を保持したまま、代表的な問題への還元を段階的により困難にする、体系的な実例の修正を適用するものである。
- 結果として、一部の大規模モデルは還元によってパズルを解ける場合があるが、別のモデルは早い段階で失敗し、いずれのモデルもタスクが真に認識論的推論を必要とする局面では苦戦することが示される。