ReLUからのトランスフォーマ近似

arXiv cs.LG / 2026/4/29

📰 ニュースIdeas & Deep AnalysisModels & Research

要点

  • この論文は、ReLUの近似結果をトランスフォーマのソフトマックス注意機構における近似結果へ変換するための体系的な手法を提示しています。
  • 提案される「レシピ」は、一般的なユニバーサル近似の主張を超え、ターゲット固有で、より経済的なリソース(計算量)境界を与えます。
  • この手法は、乗算、逆数計算、min/maxといった重要な計算プリミティブに対して実証されています。
  • 著者らは、この成果をソフトマックス型トランスフォーマ・モデルの能力や限界をより適切に分析するための新しい解析ツールとして位置づけています。
  • 本研究はarXivのpreprint(v1)として公開されており、研究コミュニティへの初期段階の貢献であることを示しています。