時系列に対する記号推論を大規模言語モデルは十分に行えるか？

arXiv cs.AI / 2026/4/27

💬 オピニオンIdeas & Deep AnalysisModels & Research

共有:

要点

大規模言語モデルは構造化された推論課題で有望である一方、時系列データから解釈可能で文脈に整合した記号的な法則を推定する能力は、依然として十分に検討されていないと論じています。
同論文では、SymbolBench を提案し、時系列（実世界データ）上での記号推論を評価するベンチマークとして、多変量の記号回帰、ブールネットワーク推論、因果発見の3タスクを対象にしています。
さらに、LLM と遺伝的プログラミングを組み合わせた「閉ループ」の記号推論フレームワークを提案し、LLM が予測者であり評価者としても振る舞うことで仮説を反復的に改善します。
実験結果から、現行手法の強みと限界が示され、LLM の自動科学発見への適用を高めるには、ドメイン知識、文脈整合、推論構造の明示的な組み合わせが重要であることが強調されています。
実装はプロジェクトの GitHub リポジトリで公開されています。