構造的アラインメントとしての情報:継続学習の力学的理論
arXiv cs.LG / 2026/4/9
📰 ニュースIdeas & Deep AnalysisModels & Research
要点
- 本論文は、壊滅的忘却(catastrophic forgetting)が、工学的な不備というよりも、知識を「グローバルなパラメータの重ね合わせ(スーパー ポジション)」として保持することに起因して数学的に生じる、と主張する。
- 情報が構造的アラインメントによって実現されるとして、学習は (1) コヒーレンスを増大させる運動の法則(Law of Motion)と、(2) 局所的な誤差に基づいてコヒーレンスの地形を再形成する修正ダイナミクス(Modification Dynamics)に駆動される、Informational Buildup Framework(IBF)を提案する。
- リプレイ、正則化、凍結サブネットワークなどの外部メカニズムを追加する従来の継続学習手法とは異なり、IBFは学習ダイナミクスそのものから記憶と自己修正を生成することを目指す。
- 著者らは、まず2次元のおもちゃ設定でライフサイクル全体を示し、その後、3つのベンチマークでIBFを評価する。これには、非定常な制御、Stockfishにより独立にスコア付けされたチェス、凍結したViTエンコーダを用いたSplit-CIFAR-100が含まれる。
- 結果として、報告によれば、生データを保存せずにリプレイよりも保持が優れる、つまりCIFAR-100でほぼゼロの忘却(BT = -0.004)、チェスで正の後方転移(+38.5 cp)、制御領域でリプレイよりも忘却が抑えられており、さらにベースラインに対してチェスで強い独立した優位性が得られたという。




