要旨: 関連するすべての変数が分かった後でも、一般化に対する障壁はまだ存在するのでしょうか? 私たちは、合成的(compositional)な一般化を、パラメトリックな相互作用を伴う潜在変数上の変分推論問題として捉える枠組みにより、この問いに取り組みます。これを探るために、複数の潜在変数によって観測が共同で生成される一方で、フィードバックはただ一つの目標変数に対してのみ与えられる、定常な部分観測マルコフ決定過程(POMDP)である Cognitive Gridworld を構築します。この設定により、潜在変数どうしの相互作用が課題の遂行にどれだけ寄与するかを測る指標である Semantic Interaction Information(SII)を定義することができます。SII を用いて、これらの相互作用を与えられた回帰型ニューラルネットワーク(RNN)を解析し、その結果、SII が Echo State ネットワークと Fully Trained ネットワークの間にある精度差を説明することを見出します。また、本解析は、確信(confidence)が精度(accuracy)から切り離されるという理論的に予測された失敗モードも明らかにし、関連する変数同士の相互作用を活用することは自明ではない能力であることを示唆します。
次に、相互作用を埋め込みモデルによって学習しなければならない、より難しい状況に取り組みます。潜在変数がどのように相互作用するかを学ぶには正確な推論が必要ですが、その正確な推論は、それらの相互作用を知っていることに依存します。Cognitive Gridworld は、この循環的な依存関係を、継続的メタ学習における中核的な課題として明らかにします。私たちはこのジレンマに対し、これらの処理を切り分ける JEPA スタイルのアーキテクチャである Representation Classification Chains(RCCs)によってアプローチします。変数の推論と変数の埋め込みは、それぞれ別個のモジュールによって学習され、前者は強化学習、後者は自己教師あり学習を通じて学習されます。最後に、RCCs が、関連する変数の新しい組み合わせに対する合成的な一般化を促進することを示します。これらの結果は、目標指向の汎用エージェントを評価するための、根拠に基づいた設定を確立します。
意味的相互作用情報は潜在空間における合成的汎化を媒介する
arXiv cs.LG / 2026/3/31
💬 オピニオンSignals & Early TrendsIdeas & Deep AnalysisModels & Research
要点
- このループを断ち切るために、本論文ではJEPA型の設計に基づいて、埋め込み学習と推論学習を分離した表現分類チェーン(Representation Classification Chains, RCCs)を提案し、関連する変数の新しい組み合わせに対する合成的汎化の改善を示す。



