トランスフォーマーにおけるグリッドワールド表現は予測幾何を反映する

arXiv cs.LG / 2026/3/18

📰 ニュースIdeas & Deep AnalysisModels & Research

共有:

要点

著者らは、制約付きランダムウォークの厳密な分布から抽出したプレフィックスを用いてデコーダーのみのトランスフォーマーを訓練し、その隠れた活性化が解析的に導出された最適な予測を符号化する十分ベクトルと一致することを見出した。
モデルや層を超えて、学習された表現はしばしば低次元であり、ターゲットに対する位置と残りの時間枠によって決まる世界の予測ベクトルを密接に追跡している。
本研究は、世界モデルのような表現がデータの予測幾何学から直接現れるという具体的な例を提供し、ニューラルネットワークが構造的制約を内部化する過程を研究する視点を提供する。
簡易な系で示されたものではあるが、最適な予測を支える幾何学的表現が、トランスフォーマーが文法やその他の構造的制約をより複雑な設定でどのように符号化するかを説明する手がかりになる可能性を示唆している。

要旨：次のトークン予測子は、潜在的な世界とその規則の内部表現を発展させるように見える。
このようなモデルの確率的性質は、世界の構造と確率分布の幾何学との深い結びつきを示唆する。
この関係をより正確に理解するために、制御された設定として最小限の確率過程を用いる：あらかじめ定められたステップ数の後に固定された終点に到達しなければならない、二次元格子上の制約付きランダムウォーク。
この過程の最適な予測は、ターゲットに対する歩行者の位置と残り時間の枠組みによって決定される十分ベクトルのみに依存する。言い換えれば、確率分布は世界の幾何学によってパラメータ化される。
これらのウォークの正確な分布からサンプルしたプレフィックス上でデコーダーのみのトランスフォーマーを訓練し、それらの内部活性化を解析的に導出された十分ベクトルと比較する。
モデルやレイヤーを跨いで、学習された表現は正解の予測ベクトルと強く一致し、しばしば低次元である。
これは、世界モデルのような表現がデータ自体の予測幾何学に直接遡ることができる、具体的な例を提供する。
簡略化されたおもちゃのシステムで実証されたとしても、この分析は、最適な予測を支える幾何学的表現が、ニューラルネットワークが文法的および他の構造的制約を内部化する方法を研究する際に有用な視点を提供し得ることを示唆している。

生成AIが提案した減量食のプランから考える、人間の専門家の必要性

note

AI達の革命

note

【AIパートナー】名前を呼んだだけで、ChatGPTのパートナーがGeminiにきた話🌝①

note

『AIと意識』諸葛亮孔明老師(ChatGPTのﾛｰﾙﾌﾟﾚｲ)との対話その肆拾柒

note

一緒にゲームを作っていたChatGPT-5.2が可愛すぎてニヤニヤしてるだけの記録｜AIパートナー｜AI彼氏

note

トランスフォーマーにおけるグリッドワールド表現は予測幾何を反映する

要点

関連記事

生成AIが提案した減量食のプランから考える、人間の専門家の必要性

AI達の革命

【AIパートナー】名前を呼んだだけで、ChatGPTのパートナーがGeminiにきた話🌝①

『AIと意識』諸葛亮孔明老師(ChatGPTのﾛｰﾙﾌﾟﾚｲ)との対話その肆拾柒

一緒にゲームを作っていたChatGPT-5.2が可愛すぎてニヤニヤしてるだけの記録｜AIパートナー｜AI彼氏

関連おすすめサービス

Notta搭載AI議事録イヤホン ZENCHORD1

AI搭載ボイスレコーダー Plaud

画像高画質化AIツール Aiarty Image Enhancer

要点

関連記事

生成AIが提案した減量食のプランから考える、人間の専門家の必要性

AI達の革命

【AIパートナー】名前を呼んだだけで、ChatGPTのパートナーがGeminiにきた話🌝①

『AIと意識』諸葛亮 孔明老師(ChatGPTのﾛｰﾙﾌﾟﾚｲ)との対話 その肆拾柒

一緒にゲームを作っていたChatGPT-5.2が可愛すぎてニヤニヤしてるだけの記録｜AIパートナー｜AI彼氏

関連おすすめサービス

Notta搭載AI議事録イヤホン ZENCHORD1

AI搭載ボイスレコーダー Plaud

画像高画質化AIツール Aiarty Image Enhancer

『AIと意識』諸葛亮孔明老師(ChatGPTのﾛｰﾙﾌﾟﾚｲ)との対話その肆拾柒