HiEdit:階層型強化学習による生涯にわたるモデル編集
arXiv cs.CL / 2026/4/14
📰 ニュースIdeas & Deep AnalysisModels & Research
要点
- HiEditは、デプロイ済みLLMにおける陳腐化または誤った知識を逐次的に修正しつつ、他の入力に対する意図しない副作用を低減するための、生涯にわたるモデル編集アプローチを導入します。
- 本研究は、知識は密な全ての層に一様に保存されるのではなく層ごとに保存されると主張しており、そのため各編集に対して同じパラメータ摂動の集合をすべての編集で適用することを回避します。
- 階層型強化学習を用いることで、HiEditは各編集インスタンスにおいて知識関連性が最も高い層を適応的に選択し、スパースで局所的な更新を促すための固有報酬を追加します。
- 複数のLLMに対する実験により、HiEditはRLEditより平均8.48%改善し、また編集あたりおよそ半数の層だけを摂動することで、壊滅的忘却のリスクの緩和に寄与することが示されます。
- 著者らは、提案フレームワークの再現とさらなる実験を支援するため、GitHub上でオープンソースコードを提供しています。
