織り込み(Weaves)、配線(Wires)、および射(Morphisms):深層学習の代数を形式化し実装する

arXiv cs.LG / 2026/4/9

💬 オピニオンDeveloper Stack & InfrastructureIdeas & Deep AnalysisModels & Research

要点

  • 本論文は、深層学習モデルが正確な関数を計算する一方で、モデル構造を厳密に記述し、構成(合成)するための広く用いられた形式的な数学的枠組みが存在しないことを論じている。
  • 新たに「axis-stride(軸ストライド)」という概念を導入し、それによってテンソルのブロードキャスティングを形式化する、そして「array-broadcasted categories(配列ブロードキャスト型の圏)」を導入することで、カテゴリ理論の枠組みを提案している。
  • この枠組みは、アーキテクチャの数学的関数を構成的で操作可能な形で表現し、それらの定義を人が読める図と、機械が読めるデータ構造の両方へと変換する。
  • アプローチの実証として、著者らはPython(pyncd)およびTypeScript(tsncd)による参照実装を提示し、代数的な構築、グラフへの変換、PyTorchのコンパイル、図の描画といった機能を備えている。
  • 本研究の目的は、深層学習モデル設計と解析のための体系的で形式的なワークフローを可能にし、場当たり的な記法や疑似コードへの依存を減らすことにある。

要旨:深層学習モデルが明確に定義された数学関数を適切に実行できる一方で、モデルのアーキテクチャを記述するための形式的な数学的枠組みが欠けています。場当たり的な記法、図、疑似コードは、非線形のブロードキャストや、個々の構成要素と合成されたモデルとの関係をうまく扱えません。本論文では、新たな軸ストライド(axis-stride)および配列ブロードキャスト(array-broadcasted)というカテゴリを導入することで、ブロードキャストを形式化する深層学習モデルのための圏論的枠組みを提案します。これにより、アーキテクチャの基底にある数学関数を、合成的な(compositionally)方法で正確に表現し、操作できるようになります。これらの数学的定義は、扱いやすい人間向けの図および機械向けのデータ構造へと翻訳されます。さらに、Python(pyncd)およびTypeScript(tsncd)において、代数的構築、グラフ変換、PyTorchのコンパイル、図のレンダリングといった機能を含む、枠組みの普遍的側面を示すミラー実装を提供します。これは、深層学習モデルの設計と解析に対する体系的で形式的なアプローチの基盤を築くものです。