Transformerにおける文脈的関係の表現力について
arXiv cs.LG / 2026/3/30
💬 オピニオンIdeas & Deep AnalysisModels & Research
要点
- 本論文は、Transformerが文脈的関係を経験的にうまく捉える一方で、その表現力が数学的に十分には特徴づけられていないことを主張する。
- テキストを意味埋め込み空間上の確率測度として扱い、文脈的関係を結合(カップリング)測度によって表現する、測度論的枠組みを提案する。
- 著者らは、この結合測度の設定のためのトランスフォーマー風アーキテクチャである「Sinkhorn Transformer」を導入する。
- 主な貢献は、確率測度間の連続な結合関数が、適切なパラメータを用いたSinkhorn Transformerによって一様に近似可能であることを示す普遍近似定理である。



