ニューロンは原始的オペレータを夢を見るか？Wake-Sleep圧縮がSchankのイベント意味論を再発見する

arXiv cs.AI / 2026/3/30

💬 オピニオンIdeas & Deep AnalysisModels & Research

共有:

要点

本論文は、Schankの概念依存理論におけるようなイベントの「原始的オペレータ」を、言語的直観から手作業で符号化するのではなく、圧縮/MDLによって自動的に発見できるかを検証する。
DreamCoderのwake-sleep手法を適応し、前/後の世界状態に対応するイベントのペアから、少数の汎用的プリミティブを出発点としてオペレータの合成を学習し、最小記述長（Minimum Description Length）の圧力によって新しいオペレータを誘導する。
合成ベンチマークでは、発見されたオペレータはSchankが手で符号化した原始的プリミティブと非常に近く（ベイズMDLで約4%以内）、全てのイベントを説明できるのに対し、Schankの手法は約81%である。
ATOMICの常識データでは、Schankの元のプリミティブが説明できるのは約10%のイベントにとどまる一方で、学習されたライブラリは100%を説明できる。支配的に発見されたオペレータは、純粋に身体的な行為というよりも、心的状態や感情の変化に焦点を当てている。
著者らは、圧縮圧力が正当化されたイベント・プリミティブを生み出し得るという初めての実証的証拠であると主張し、また真のプリミティブの集合はかなり豊富であること、特に思考や感情を含む自然言語ではその傾向が強いことを述べる。

要旨: それができることを示します。Schankの概念依存理論は、すべての出来事は、言語的な直感から人手で符号化された基本操作――ATrans、PTRANS、MTRANS など――に分解されると提案しました。同じ基本操作を、圧縮の圧力だけによって自動的に発見できるのでしょうか？
私たちは、DreamCoderのウェイク-スリープ・ライブラリ学習を、出来事の状態変換へ適応します。出来事をこれまでどおり「前後の世界状態」の組として与えると、システムは各出来事（ウェイク）を説明する演算子の合成を見つけ、次に繰り返し現れるパターンを、新しい演算子として抽出します。それらの新演算子は、Minimum Description Length（最小記述長, MDL）のもとで最適化されます（スリープ）。4つの汎用的な基本操作から始めることで、システムはSchankのそれに直接対応する演算子を発見します：MOVE_PROP_has = ATRANS、CHANGE_location = PTRANS、SET_knows = MTRANS、SET_consumed = INGESTに加えて、複合演算子（"mail" = ATRANS + PTRANS）や、Schankの分類法には存在しない新しい情動状態演算子が得られます。
合成データの出来事および、ATOMIC知識グラフから得た現実世界の常識データで検証します。合成データでは、発見された演算子が、Schankの人手による基本操作に対してベイズ流MDLを4%以内で達成し、Schankが81%であるのに対し、100%の出来事を説明できます。ATOMICでは結果はさらに顕著です。Schankの基本操作は、自然主義的な出来事のうちわずか10%しか説明できないのに対し、発見されたライブラリは100%を説明します。支配的な演算子は、物理的な行為の基本操作ではなく、思考や情動状態の変化です――CHANGE_wants（20%）、CHANGE_feels（18%）、CHANGE_is（18%）――これらはSchankの当初の分類法には含まれていません。
これらの結果は、出来事の基本操作が圧縮の圧力から導出できること、Schankの中核となる基本操作が情報理論的に正当化されること、そして完全な目録が提案されたものより実質的にずっと豊富であり、とりわけ自然主義的データでは精神／情動の演算子が支配的であることを、最初の実証的な証拠として示します。