マルチトークン予測と潜在意味強化による、一貫したワールドモデルへのアプローチ

arXiv cs.LG / 2026/4/8

💬 オピニオンSignals & Early TrendsIdeas & Deep AnalysisModels & Research

要点

  • 本論文は、大規模言語モデルが首尾一貫した内部ワールドモデルを形成できるかを検討し、マルチトークン予測(MTP)が表現を内部的に一貫した「信念状態」へと押し進め得ると主張している。
  • MTPの勾配に関する帰納的バイアスを理論的に分析し、勾配の結合によって表現の収縮性(contractivity)が誘導され、収束を支えると論じている。
  • 著者らは、標準的なMTPの失敗モードとして「構造的ハルシネーション」を特定する。これは、離散トークンの教師信号によって環境の制約を破る不正な潜在空間のショートカットが生じる現象である。
  • これを緩和するために、潜在意味強化MTP(LSE-MTP)を提案し、予測ターゲットを真の隠れ状態の軌跡に固定することで、トークン単位の出力と連続的な潜在ダイナミクスとの結びつきをより良くする。
  • 合成グラフおよびManhattan Taxi Rideドメインでの実験により、LSE-MTPが表現の整合性を改善し、構造的ハルシネーションを低減し、摂動に対する頑健性を高めることが示されている。

概要: 大規模言語モデル(LLM)が首尾一貫した内部の世界モデルを発達させるかどうかは、依然として主要な議論である。従来の次トークン予測(NTP)は1ステップ先の教師信号に焦点を当てるのに対し、多トークン予測(MTP)は、より構造化された表現の学習に有望であることが示されている。本研究では、経験的証拠に支えられた理論的観点から、勾配に基づくMTPの帰納的バイアスを分析し、勾配結合によって表現の収縮性(contractivity)が誘導されることで、MTPが内部の信念状態へ向かう収束を促進することを示す。さらに、本来のMTPはしばしば構造的ハルシネーションに悩まされることを明らかにする。すなわち、離散トークンの教師信号が、潜在空間における不正な近道を促し、環境の制約に違反するのである。これに対処するため、潜在意味強調MTP(Latent Semantic Enhancement MTP; LSE-MTP)という新しい手法を提案する。これは、予測を真の隠れ状態の軌跡(ground-truth hidden state trajectories)に固定(アンカー)する。合成グラフおよび実世界のマンハッタン・タクシー・ライドに関する実験では、LSE-MTPが離散トークンと連続状態表現の間のギャップを効果的に埋め、表現の整合性を高め、構造的ハルシネーションを減らし、摂動に対する頑健性を向上させることが示される。