差分可能な記号計画：学習された実行可能性に基づく制約推論のためのニューラル・アーキテクチャ

arXiv cs.AI / 2026/4/6

💬 オピニオンIdeas & Deep AnalysisModels & Research

共有:

要点

本論文は、論理／物理的制約推論を扱いながら完全に差分可能な状態を維持することを目的としたニューラル・アーキテクチャ「差分可能な記号計画（DSP）」を提案する。
DSPは、各ノードに対する実行可能性チャネル（φ）と、制約充足の証拠を記号推論の過程で追跡し統合する学習済みのグローバルな実行可能性アグリゲータ（Φ）を導入する。
スパースマックス・アテンションを用いることで、厳密なゼロとなる離散ルール選択が可能となり、DSPは離散的な記号ステップと勾配ベース学習の橋渡しを実現する。
DSPをUniversal Cognitive Kernel（UCK）に統合すると、グラフ到達可能性、ブール充足可能性、計画の実行可能性において強力なベンチマーク結果が示され、大きな汎化性能の向上が得られる。
アブレーションでは、グローバルなΦの集約を除去すると性能が大きく低下することが分かる。また、学習された実行可能性シグナル（φ）は教師なしで、実行可能／不可能のケースを区別する解釈可能な値へと発達する。

要旨: ニューラルネットワークはパターン認識に優れる一方で、制約推論――与えられた構成が論理的または物理的な制約を満たしているかどうかの判断――は苦手です。そこで本研究では、完全に微分可能なまま離散的な記号推論を実行するニューラルアーキテクチャ、Differentiable Symbolic Planning（DSP）を提案します。DSPは、各ノードにおける制約充足の根拠を追跡する実現可能性チャネル（phi）を保持し、学習されたルール重み付きの組み合わせによってそれをグローバルな実現可能性信号（Phi）へ集約し、sparsemax attentionを用いて厳密なゼロの離散ルール選択を実現します。さらに、DSPをUniversal Cognitive Kernel（UCK）に統合し、グラフ注意と反復的な制約伝播を組み合わせます。3つの制約推論ベンチマーク――グラフ到達可能性、ブール充足可能性（SAT）、計画の実現可能性――で評価したところ、UCK+DSPは4倍のサイズの一般化下で計画の精度97.4%を達成しました（アブレーションしたベースラインでは59.7%）。また2倍の一般化下でSATの精度は96.4%を達成し、標準的なニューラル手法が崩れてしまう正例・負例の両クラスに対してバランスの取れた性能を維持します。アブレーション研究から、グローバルphi集約が重要であることが明らかになりました。これを取り除くと精度が98%から64%へ低下します。学習されたphi信号は解釈可能な意味論を示し、監督なしで実現可能なケースでは+18、実現不可能なケースでは-13という値が現れます。