なぜすべてに注意を向けるのか？鍵はフォーカス

arXiv cs.CL / 2026/4/7

📰 ニュースDeveloper Stack & InfrastructureIdeas & Deep AnalysisModels & Research

共有:

要点

本論文は、注意のすべてのトークン対を近似するのではなく、学習可能なセントロイドを用いて重要なトークン対を学習する、加法的注意手法「Focus」を提案する。
Focusはモデルの全重みを凍結し、セントロイドのパラメータのみを学習する（約148K程度といった少数）。その結果、下流ベンチマーク性能をモデルサイズが最大70Bまでの範囲で低下させることなく、ドメインのパープレキシティを改善する。
推論時、Focusはtop-kのグループ選択によってルーティングを離散化し、ハードなスパース性を生成する。これにより、事前学習ベースラインに対してパープレキシティを改善しつつ、約2倍の速度向上を得る。
著者らは、ルーティング・パターンを2つの標準的なFlashAttention呼び出しに分解することで、カスタムカーネルを回避しつつ、1Mトークンでのウォールクロック速度を8.6倍向上させたと報告している。
Focusは、LoRAよりも指示整合性を保てると主張しており（TruthfulQAの保持率が高い）、教師なしで、Sinkhorn正規化によりバランスが取れ解釈可能な言語グルーピングを強制する。

Abstract

私たちはFocusという方法を提案します。これは、すべてのトークン対を近似するのではなく、どのトークン対が重要かを学習します。学習可能なセントロイドがトークンをグループに割り当て、遠距離の注意（attention）は同一グループの組にのみ制限されます。一方、局所的な注意はフル解像度で動作します。モデルの全重みを凍結したままにするため、Focusは純粋に加法的です。セントロイドのみの学習（パラメータ数はわずか148K）によって、下流ベンチマークでの劣化ゼロのままドメインのパープレキシティが改善されます――124Mから70Bパラメータまで、5種類の注意アーキテクチャにわたって。既存の効率的注意手法は、このリトロフィット（後付け）設定において、この水準を達成できていません。124MではFocusがフル注意を上回ります（30.3 vs 31.4 PPL）。さらに7Bスケール（2Bトークン）でスクラッチから学習した場合も、Focusは再びフル注意を上回ります（13.82 vs 13.89 PPL）。推論時には、各トークンをその上位k個のスコアが最も高いグループに限定することで、ソフトなルーティングを離散的なハードなスパース性パターンに変換します。これにより、事前学習ベースラインを上回りつつ2倍の速度向上が得られます（41.3 vs 42.8 PPL）。このパターンを2回の標準FlashAttention呼び出しに分解すると、カスタムカーネルなしで、1Mトークンにおいてウォールクロックベースで8.6倍の速度向上が実現します。LoRAとは異なり、セントロイド・ルーティングはアライメントを保持します。命令チューニング済みモデルでは、適応後もTruthfulQAスコアが維持されますが、LoRAは学習率およびランクのすべてで劣化します。Sinkhorn正規化は、ハード制約としてグループのバランスを保証し、その結果得られるグループは、教師なしで解釈可能な言語的カテゴリを発見します。

安川電機、人型ロボをオフィスへフィジカルAIで「臨機応変」実現

日経XTECH

フィジカルAIは日本の好機、米中と違う勝ち筋3つ FAに起こる地殻変動

日経XTECH

人型ロボット、中国が圧倒的に先行日本はコア部品技術で挽回へ

日経XTECH

デンソーのE2E自動運転戦略、VLA内製へ CTO「レベル4相当目指す」

日経XTECH

SHIFT丹下社長「新入社員にも『AIで君の仕事はなくなる』と伝え、考えさせる」

日経XTECH

なぜすべてに注意を向けるのか？鍵はフォーカス

要点

Abstract

関連記事

安川電機、人型ロボをオフィスへフィジカルAIで「臨機応変」実現

フィジカルAIは日本の好機、米中と違う勝ち筋3つ FAに起こる地殻変動

人型ロボット、中国が圧倒的に先行日本はコア部品技術で挽回へ

デンソーのE2E自動運転戦略、VLA内製へ CTO「レベル4相当目指す」

SHIFT丹下社長「新入社員にも『AIで君の仕事はなくなる』と伝え、考えさせる」

関連おすすめサービス

Notta搭載AI議事録イヤホン ZENCHORD1

AI搭載ボイスレコーダー Plaud

画像高画質化AIツール Aiarty Image Enhancer

要点

Abstract

関連記事

安川電機、人型ロボをオフィスへ フィジカルAIで「臨機応変」実現

フィジカルAIは日本の好機、米中と違う勝ち筋3つ FAに起こる地殻変動

人型ロボット、中国が圧倒的に先行 日本はコア部品技術で挽回へ

デンソーのE2E自動運転戦略、VLA内製へ CTO「レベル4相当目指す」

SHIFT丹下社長「新入社員にも『AIで君の仕事はなくなる』と伝え、考えさせる」

関連おすすめサービス

Notta搭載AI議事録イヤホン ZENCHORD1

AI搭載ボイスレコーダー Plaud

画像高画質化AIツール Aiarty Image Enhancer

安川電機、人型ロボをオフィスへフィジカルAIで「臨機応変」実現

人型ロボット、中国が圧倒的に先行日本はコア部品技術で挽回へ