タスクの生態系と、大規模言語モデルにおける世界追跡表現の進化

arXiv stat.ML / 2026/4/8

💬 オピニオンIdeas & Deep AnalysisModels & Research

共有:

要点

論文は、自己回帰による次トークン学習が「世界（潜在状態）を追跡する表現」をいつ選好するのかを、言語モデルを“進化するモデル生物”として分析する枠組みを提示している。
次トークンの交差エントロピーを、不可避の条件付きエントロピーと、Jensen–Shannonの超過項に分解し、この超過項が消えるのは訓練生態系の同値類を表現が保持している場合に限られると述べている。
この結果から、言語モデルにおける「生態学的な真実性（ecological veridicality）」の定量的定義と、最小複雑度で超過ゼロを達成する解が“訓練同値による商分割（quotient partition）”になることを導く。
Transformerについては、凍結Dense/凍結MoEでは固定符号化の解析が成り立つ一方、in-context learningは分離集合を広げず、タスクごとの適応は前提を崩すことを示している。

Abstract

私たちは言語モデルを進化するモデル生物として研究し、自回帰的な次トークン学習が、いつワールド追跡（world-tracking）の表現を選択するのかを問います。潜在的な世界状態の任意の符号化に対して、ベイズ最適な次トークンのクロスエントロピーは、不可減の条件付きエントロピーと、Jensen--Shannon の超過（excess）項に分解されます。この超過は、符号化が学習生態系の同値類（equivalence classes）を保存している場合に限って消失します。これにより、言語モデルに対する生態学的真実性（ecological veridicality）の厳密な概念が得られ、最小複雑性のゼロ超過解を、学習同値による商分割（quotient partition）として特定できます。次に、この固定符号化（fixed-encoding）の解析がトランスフォーマー系にどのようなときに適用されるのかを決定します。固定化された密（dense）型および固定化された Mixture-of-Experts（MoE）トランスフォーマーはこれを満たしますが、in-context learning はモデルの分離集合（separation set）を拡大せず、タスクごとの適応（per-task adaptation）は前提を破ります。この枠組みは、2 つの特徴的な失敗モードを予測します。すなわち、単純さ圧力（simplicity pressure）が得の小さい区別を優先的に取り除き得ること、そして学習で最適なモデルであっても、学習生態系を洗練するデプロイ生態系（deployment ecologies）では正の超過を被り得ることです。条件付きの動的拡張により、明示的な遺伝（heredity）、変異（variation）、選択（selection）の仮定の下で、モデル間の選択と事後学習（post-training）によって、そのようなギャップの区別を回復できることを示します。関連する量が直接観測可能なレジームにおいて、有限の生態系に対する厳密な検査と、制御された microgpt の実験により、静的分解、分割・併合（split-merge）しきい値、オフ生態系における失敗パターン、ならびに 2 つの生態系による救済メカニズムが検証されます。本研究の目標は、大規模なフロンティア・システムをモデル化することではなく、小型言語モデルを実験室のモデル生物として用い、表現選択に関する理論のための知見を得ることにあります。

AIが数学の未解決問題を相次いで解決、証明の鍵は「形式化」

日経XTECH

[N] ミラ・ジョヴォヴィッチが開発者で、AIに投資していて、プロジェクトをオープンソースしたことを今知った

Reddit r/MachineLearning

ALTK‑Evolve: AIエージェントの業務中学習（オン・ザ・ジョブ・ラーニング）

Hugging Face Blog

コンテキストウィンドウが（ばかげるほど）大きくなっている――それは良いことだ

Dev.to

Geminiが素晴らしくても、GoogleはAIファースト企業ではない

Reddit r/artificial

タスクの生態系と、大規模言語モデルにおける世界追跡表現の進化

要点

Abstract

関連記事

AIが数学の未解決問題を相次いで解決、証明の鍵は「形式化」

[N] ミラ・ジョヴォヴィッチが開発者で、AIに投資していて、プロジェクトをオープンソースしたことを今知った

ALTK‑Evolve: AIエージェントの業務中学習（オン・ザ・ジョブ・ラーニング）

コンテキストウィンドウが（ばかげるほど）大きくなっている――それは良いことだ

Geminiが素晴らしくても、GoogleはAIファースト企業ではない

関連おすすめサービス

Notta搭載AI議事録イヤホン ZENCHORD1

AI搭載ボイスレコーダー Plaud

画像高画質化AIツール Aiarty Image Enhancer