継続学習において構造はいつ重要になるのか?次元数がモジュール性と表現幾何の関係を左右する

arXiv cs.LG / 2026/5/1

💬 オピニオンIdeas & Deep AnalysisModels & Research

要点

  • 本研究は、継続学習において「新しい知識を獲得する可塑性」と「過去の表現を保つ安定性」の両立をめぐり、構造的分離がいつ有効/有害になるのかを扱う。
  • タスク類似度(低・中・高)に加えて、重み初期化のスケール(学習された表現の有効次元数を変え、学習レジームを変化させる)を系統的に操作し、モジュール型再帰ネットと単一モジュール基線を比較する。
  • 高次元レジームでは、表現が十分に自由度を持つため複数タスクを強い干渉なしに収容でき、アーキテクチャの影響は小さいことが示される。
  • 一方で低次元レジームでは、構造的分離が決定的になり、タスク間の関係に応じてタスク固有サブスペースの「幾何」が段階的に変化する(類似タスクでは整列、やや非類似では部分的直交化、不一致ではより強い分離)。
  • これらより、表現の次元数が「構造的分離が機能的に意味を持つ条件」を整理する重要な変数であり、継続学習システム設計の中核原理として“適応的な幾何”を示唆している。

Abstract

既に学習された表現を保持するために、継続学習システムは、可塑性(新しい知識を獲得する能力)と安定性のバランスを取らなければなりません。この安定性-可塑性のジレンマは、タスク間で表現を再利用できる方法に影響します。共有された構造はタスクが類似している場合には転移を可能にしますが、新しい学習が既存の表現を壊すことで干渉を誘発することもあります。しかし、構造的分離がこのトレードオフに対して「いつ」「なぜ」影響するのかは依然として不明です。本研究では、転移-干渉研究に触発された逐次タスクのパラダイムにおいて、ネットワークのアーキテクチャ、タスクの類似性、表現の次元性が学習をどのように共同で形作るかを調べます。タスク分割されたモジュール型リカレントネットワークと、単一モジュールのベースラインを比較し、タスク類似性(低・中・高)と、重み初期化のスケール(異なる学習レジームを生み、それを経験的に、学習された表現の有効次元性を通じて特徴づけます)を体系的に変化させます。その結果、表現が十分に制約されず、強い干渉なしに複数タスクに対応できる高次元レジームでは、アーキテクチャの影響は最小であることがわかりました。対照的に、低次元(豊かな)レジームでは、アーキテクチャ上の分離が決定的です。モジュールネットワークは、類似タスクではタスク固有サブスペースの段階的な整合(アラインメント)と重なりを示し、中程度に非類似なタスクでは部分的な直交化を示し、非類似なタスクではより強い分離を示します。この段階的な幾何学的性質は、単一ネットワークのベースラインには見られません。本研究の発見は、表現の次元性が、構造的分離が機能的に関連し始める「時」を左右する重要な組織化変数であることを示唆しており、継続学習システムを設計するための中心原理として適応的な幾何(adaptive geometry)を強調します。