QUEST:クエリで変調する球面注意による頑健な注意の定式化
arXiv cs.AI / 2026/4/2
💬 オピニオンSignals & Early TrendsIdeas & Deep AnalysisModels & Research
要点
- 本論文は、標準的なTransformerの注意機構において、クエリ/キーのベクトルノルムが制御されずに増大することによって生じる学習の不安定性を分析し、その要因としてデータ内の紛れ込み(spurious)パターンが引き金になる可能性を示す。
- 提案手法QUEST(Query-modulated Spherical Attention)は、キーを超球面の潜在空間に制約しつつ、各トークンが注意の鋭さ(sharpness)を変調できるようにする。
- QUESTは標準的な注意機構のドロップイン置換として設計されており、周辺のTransformer構成要素を変更することなく安定性の向上を狙う。
- 画像タスク(および追加の領域)に関する実験では、QUESTが不安定性なく学習でき、より高い性能を達成することが報告されており、データの破損や敵対的攻撃への頑健性も含まれる。

