マスターキー仮説:線形部分空間整列によるモデル間能力移転の解錠
arXiv cs.LG / 2026/4/9
📰 ニュースSignals & Early TrendsIdeas & Deep AnalysisModels & Research
要点
- 本論文はマスターキー仮説を提案し、特定の事後学習された能力が低次元の潜在部分空間内の方向に対応しており、再学習なしで線形整列によりモデル規模をまたいで転送可能であると主張する。
- UNLOCKを導入する。これは学習不要・ラベル不要の手法であり、能力が存在するソース変種と能力が欠如するソース変種の活性化を対比することで能力の方向を抽出し、その後推論時にターゲットモデルへ整列させて適用する。
- 推論タスク(Chain-of-Thoughtや数学的推論を含む)での実験では、異なるモデルサイズ間で転送する場合でも、大きなモデル間改善が示される。
- 報告された結果として、Qwen1.5-14BからQwen1.5-7BへCoT推論を転送した際にMATH精度が12.1%向上し、さらにQwen3モデルのバリアント間で数学的推論を転送した際にはAGIEval Mathが61.1%から71.3%へ増加した。
- 著者らは、移転の成功は事前学習から存在している能力に依存すると論じており、本介入は成功した推論の軌道へ向けて出力分布を鋭くすることで機能するのだと示唆している。



