ターゲット志向の事前学習データ選択を神経(ニューロン)活性化グラフで行う手法
arXiv cs.CL / 2026/4/20
📰 ニュースIdeas & Deep AnalysisModels & Research
要点
- 本論文は、オフ・ザ・シェルフのLLMにおけるニューロン活性のパターンを用いて、ターゲット志向の言語モデル事前学習データを選択するための、学習不要かつ解釈可能な手法「Neuron-Activated Graph(NAG)Ranking」を提案する。
- 重要度の高いニューロンを層をまたいで選び、コンパクトなNAGとして構築したうえで、NAG類似度にもとづいて候補データをターゲット例にどれだけ近いかで順位付けする。
- 6つのベンチマークで検証した結果、ターゲット志向の事前学習でランダムサンプリングに対して平均4.9%の改善を示し、HellaSwagではSOTA基準より5.3%高い精度を達成する。
- より実用的なマルチターゲット設定でも有効であり、最良構成は2つのベースラインをそれぞれ1.1%と4.1%上回る。
- 解釈可能性の分析として、NAG選択されたニューロン(全体の0.12%のみ)を無効化すると23.5%の性能崩壊が起き、NAGを最終層に限定すると平均4.1%の低下が生じることを示し、ターゲット特徴学習のための疎な「機能的バックボーン」を捉えていることを示唆する。



