LLMの問題解決における一般化：最短経路の事例

arXiv cs.AI / 2026/4/17

📰 ニュースIdeas & Deep AnalysisModels & Research

共有:

要点

本論文は、最短経路計画を用いた統制された合成ベンチマークにより、LLMが体系的に一般化できるかを検証する。
トレーニングデータ、学習パラダイム、推論時戦略といった複数の要因を切り分け、一般化の軸として(1)未見の地図への空間転移と(2)より長いホライズンへの長さスケーリングを評価する。
その結果、未見マップへの空間転移は強い一方で、問題長の増加では一貫して失敗し、その原因は再帰的な不安定性にあると示される。
学習パイプラインの各段階を分析し、データのカバレッジが能力の上限を決めること、強化学習は主に学習の安定性を改善するが上限自体は拡張しないこと、推論時スケーリングは性能を高めても長さスケーリングの失敗は救えないことを明らかにする。
一部の一般化失敗は、単に推論戦略を工夫することで改善できるというより、再帰に伴う不安定性のような構造的要因に起因する可能性を示唆する。