ループ型トランスフォーマーにおける安定性と一般化
arXiv cs.LG / 2026/4/17
📰 ニュースModels & Research
要点
- この論文は、ループ型トランスフォーマーがテスト時により難しい入力へ一般化できるかどうかを、固定点解析の枠組みで見極める方法を提案する。
- 著者らは安定性を「到達可能性」「入力依存性」「幾何」による3つの観点で分析し、固定点反復が意味のある予測を生む条件を理論的に示す。
- さらに、リコール(recall)を伴わないループ型ネットワークは固定点が可算個に限られ、スペクトル領域のどこでも強い入力依存性を達成できないことを証明し、外挿能力の制約を明らかにする。
- リコールとアウタ正規化(outer normalization)を組み合わせることで、固定点が到達可能であり、入力に対して局所的に滑らかで、かつ安定した逆伝播を支えるレジームが得られることを示す。
- 実験(チェス、数独、プレフィックス和)では、下流タスクの性能が枠組みの予測と整合し、さらに「内部リコール(internal recall)」という新しい配置変種が、アウタ正規化適用時に標準のリコール配置を上回ることを報告する。


