タスク算術における重みのディスエンタングルメントを理解し、強制する

arXiv cs.AI / 2026/4/21

📰 ニュースDeveloper Stack & InfrastructureIdeas & Deep AnalysisModels & Research

共有:

要点

この論文は、タスク算術が実務上うまく機能する理由についての理論的説明が不足している点に取り組み、重みのディスエンタングルメントの概念に焦点を当てています。
タスクごとに異なる内部特徴を割り当てる能力である Task-Feature Specialization（TFS）を基本メカニズムとして提案し、TFS が重みのディスエンタングルメントに対して十分条件であることを証明します。
さらに、TFS が重みベクトルの直交という観測可能な幾何学的帰結を生むことを示し、望ましい機能的帰結と測定可能な幾何学的性質を結び付けています。
論文では、TFS を直接強制するのは難しいため、その代替として幾何学的性質（直交性）を通じてディスエンタングルメントを促進する方針を採ります。
提案手法 OrthoReg は微調整時にタスクベクトルを構成する重み更新（ΔW）へ内部的な直交構造を正則化で強制し、複数のタスク算術手法の性能を一貫して有意に改善することが実験で示され、コードも公開されています。

概要: タスク演算は、事前学習済みモデルを編集するための効率的で、学習なし（training-free）の方法を提供しますが、その成功を説明するための基本的な理論的根拠が欠けています。既存の概念である「重みの非絡み合い（weight disentanglement）」は、干渉しないタスク合成の理想的な結果を記述しますが、その根本原因を明らかにしません。重要なのは、事前学習済みモデル（ $\theta_0$ ）またはタスクベクトル（ $\tau_t$ ）のどのような固有の性質がこの非絡み合い（disentanglement）を可能にするのか、という点が十分に調べられていないことです。本論文では、異なるタスクに対して異なる内部特徴を割り当てるモデルの能力である、Task-Feature Specialization（TFS）を基本原理として導入します。まず、TFSが重みの非絡み合いの十分条件であることを証明します。さらに重要なことに、TFSは観測可能な幾何学的帰結も生み出すことを見出します。それは「重みベクトルの直交性（weight vector orthogonality）」です。これにより、TFSは望ましい機能的帰結（非絡み合い）と、測定可能な幾何学的性質（直交性）の両方に対する共通の原因として位置づけられます。この関係から、提案手法の核心となる洞察が得られます。すなわち、抽象的なTFS性質は直接強制することが困難である一方で、それが持つ具体的な幾何学的帰結である直交性を形成することで、重みの非絡み合いを促進できるのです。そこで本研究では、OrthoRegという単純で効果的な正則化手法を提案します。これは、微調整中にタスクベクトル（ $\tau_t$ ）を構成する重み更新（ $\Delta W$ ）に対して、内部の直交構造を能動的に強制します。そして、OrthoRegが非絡み合いを促進することを理論的に証明します。広範な実験により、OrthoRegは様々なタスク演算手法の性能を一貫して、かつ有意に向上させることが示されています。コードは \\href{https://github.com/RL-MIND/OrthoReg}{https://github.com/RL-MIND/OrthoReg} で公開されています。