グランドマスター級のチェス指向トランスフォーマーの思考を追跡する
arXiv cs.LG / 2026/4/14
💬 オピニオンSignals & Early TrendsIdeas & Deep AnalysisModels & Research
要点
- 本論文は、Leela Chess Zero(LC0)のための疎分解の解釈可能性フレームワークを提示し、その内部でトランスフォーマーモジュールがチェスの推論をどのように計算しているのかを明らかにすることを目的とする。
- MLP と注意(attention)コンポーネントの双方を、支配的な計算経路を捉えるための疎置換レイヤーを用いて分解する。
- 詳細なケーススタディにより、得られた経路が、豊かな解釈可能な戦術的考慮に対応しており、経験的に検証可能であることを示す。
- 本研究では3つの定量的指標を導入し、LC0が、ポリシーヘッドのアーキテクチャに内在する帰納的バイアスと整合した並列推論の振る舞いを示すと主張する。
- 著者らは、解釈可能性のためにトランスフォーマー内部の計算を MLP と注意モジュールの両方にわたって分解する最初のアプローチだと主張し、コードを公開している。



