LPC-SM: 長いコンテキスト向け言語モデリングのためのローカル予測符号化とスパースメモリ

arXiv cs.CL / 2026/4/7

📰 ニュースIdeas & Deep AnalysisModels & Research

共有:

要点

本論文では、ハイブリッドな自己回帰型の長コンテキスト言語モデル・アーキテクチャであるLPC-SMを提案する。これは、シーケンス処理を各ブロック内で、ローカル注意、持続的メモリ、予測による補正、そして実行時の制御に分割する。

Abstract

現在のほとんどの長文脈言語モデルは、局所的な相互作用と長距離の状態を扱うために、いまだ注意（attention）に依存しています。そのため、系列モデリングの代替的な分解（decomposition）を検証する余地は比較的小さいです。私たちは、局所的な注意、永続メモリ、予測的な修正、そして実行時の制御を同一ブロック内で分離するハイブリッド自己回帰アーキテクチャであるLPC-SMを提案します。また、低速メモリへの書き込みを制御するために、直交ノベルティ輸送（Orthogonal Novelty Transport: ONT）を用います。158Mパラメータのモデルを、基礎言語モデリング、数学的な継続、4096トークンの継続にまたがる3段階で評価します。mHCを除去すると、Stage-Aの最終LM損失は12.630から15.127へ上昇します。一方、適応的なスパース制御は、対応する固定比率の継続と比べてStage-Bの最終LM損失を12.137から10.787へ改善します。全経路は系列長4096でも安定しており、Stage Cは最終LM損失11.582で終了し、重要な交差エントロピーにおける遅延識別子診断を14.396から12.031へ改善します。これらの結果を合わせると、長文脈の自己回帰モデリングは、注意のみではないより広い分業の枠組みのもとで編成できることが示されます。

ソフトバンクG、フィジカルAIに名乗り通信がロボにもたらす賢さと速さ

日経XTECH

AIが「善良な開発者」装う時代、LLM製マルウエアがOSS文化揺さぶる

日経XTECH

大手テック企業はAI投資と統合を加速している一方で、規制当局と企業は安全性と責任ある導入に注力している

Dev.to

この推測は、あながち的外れではないのでは？

Reddit r/LocalLLaMA

npm audit は壊れている――それを直すために私が作った Claude Code のスキル

Dev.to

LPC-SM: 長いコンテキスト向け言語モデリングのためのローカル予測符号化とスパースメモリ

要点

Abstract

関連記事

ソフトバンクG、フィジカルAIに名乗り通信がロボにもたらす賢さと速さ

AIが「善良な開発者」装う時代、LLM製マルウエアがOSS文化揺さぶる

大手テック企業はAI投資と統合を加速している一方で、規制当局と企業は安全性と責任ある導入に注力している

この推測は、あながち的外れではないのでは？

npm audit は壊れている――それを直すために私が作った Claude Code のスキル

関連おすすめサービス

Notta搭載AI議事録イヤホン ZENCHORD1

AI搭載ボイスレコーダー Plaud

画像高画質化AIツール Aiarty Image Enhancer

要点

Abstract

関連記事

ソフトバンクG、フィジカルAIに名乗り 通信がロボにもたらす賢さと速さ

AIが「善良な開発者」装う時代、LLM製マルウエアがOSS文化揺さぶる

大手テック企業はAI投資と統合を加速している一方で、規制当局と企業は安全性と責任ある導入に注力している

この推測は、あながち的外れではないのでは？

npm audit は壊れている――それを直すために私が作った Claude Code のスキル

関連おすすめサービス

Notta搭載AI議事録イヤホン ZENCHORD1

AI搭載ボイスレコーダー Plaud

画像高画質化AIツール Aiarty Image Enhancer

ソフトバンクG、フィジカルAIに名乗り通信がロボにもたらす賢さと速さ