計画問題に対する大規模言語モデルの最適性の分析

arXiv cs.AI / 2026/4/6

💬 オピニオンSignals & Early TrendsIdeas & Deep AnalysisModels & Research

要点

  • 本論文は、最先端のLLMが古典的なAI計画タスクにおいて準最適な推論をどの程度達成できるかを分析し、近年の多くのベンチマークが計画の効率よりも成功率を重視している点に言及している。
  • 著者らはBlocksworldドメイン(および同等のPath-Starグラフ)を用い、深さ・幅・合成性を変化させることで、LLMが本当に位相的/計画的な推論を行っているのか、それとも意味的な事前知識(プリオル)に依存しているのかを検証する。
  • 推論強化型のLLMは、複雑な複数目標のBlocksworldインスタンスにおいて、LAMAのような従来の満足解探索型プランナーよりも優れた性能を示すと報告されている。
  • 本研究では、古典的な探索手法が探索空間の増大により組合せ的な限界に直面する一方で、意味的な手がかりを除いてもLLMが理論上の最適性の境界を高い精度で追跡できることがわかった。
  • 観測された性能向上を説明するための仮説として、推論トークンによるアルゴリズム的なシミュレーションと、グラフ位相のナビゲート可能な表現を支える幾何学的な記憶の2つが提案されている。