Inter-Layer Structural Encoders による LLM の予測改善
arXiv cs.CL / 2026/3/25
📰 ニュースSignals & Early TrendsIdeas & Deep AnalysisModels & Research
要点
- 本論文は、LLM の予測は最終層のトークン表現のみに依存する必要はなく、中間層が特定のタスクにとってより関連性の高い情報を保持し得ると主張している。
- 複数の層にある LLM 内部表現を組み合わせることで、単一で有効な表現を学習する Inter-Layer Structural Encoders(ILSE)を提案する。
- ILSE の主要コンポーネントである Cayley-Encoder は、拡張体 Cayley グラフ(expander Cayley graphs)を幾何学的で数学的に裏付けられたメカニズムとして用い、層間で構造情報を効率的に伝播させる。
- 9 個の事前学習済み LLM(14M〜8B パラメータ)を用いた 13 の分類および意味類似タスクにおいて、ILSE はベースラインおよび既存手法に比べて、精度を最大 44% 向上、類似性指標を最大 25% 向上させると報告されている。
- 本手法は少数ショット設定においてデータ効率が高いことが示されており、より小さなモデルがはるかに大きなモデルと競り合うのに役立ち得る。




