Reasoning on the Manifold:拡散言語モデルにおける自己検証のための双方向整合性

arXiv cs.LG / 2026/4/21

📰 ニュースIdeas & Deep AnalysisModels & Research

要点

  • 本論文は、拡散型大規模言語モデル(dLLM)における正しい推論の軌跡が、学習分布の高密度マニフォールド上の安定したアトラクタに対応し、不正確な経路はマニフォールドから外れるドリフトを示すと主張している。
  • 双方向マニフォールド整合性(BMC)として、前方のマスク処理と後方の復元(再構成)を組み合わせることで軌跡の安定性を評価する、学習不要の教師なし指標を提案している。
  • 実験ではBMCが推論ライフサイクル全体で有効であることを示し、正解データなしで解の妥当性を判別する(Diagnosis)、難しい推論課題に計算資源を集中させるためのリジェクション再サンプリングに使う(Inference)、疎な結果スーパービジョンを微粒度の指導へ変える密な幾何学的報酬として整合(Alignment)に適用する、ことを報告している。
  • 総じて、BMCが測る「固有の幾何学的安定性」がdLLMの正しさを示す頑健な指標になると結論づけている。

要旨: 拡散型大規模言語モデル(dLLM)は大域的計画に対する構造的な利点を提供しますが、有効な推論トレースを通じて正しい解に到達したことを効率よく検証することは、依然として重要な課題です。本研究では幾何学的な観点を提案します:Reasoning on the Manifold(多様体上での推論)。妥当な生成の軌跡は、学習された分布の高密度な多様体上に安定したアトラクタとして存在し、不正な経路は多様体外へのドリフトを示すという仮説を立てます。これを実運用するために、双方向多様体整合(Bidirectional Manifold Consistency: BMC)を導入します。これは学習不要の教師なし指標であり、順方向のマスキングと逆方向の再構成のサイクルによって生成系列の安定性を定量化します。実験的に、BMCが推論ライフサイクル全体にわたって多用途であることを示します:(1)診断において、正解データなしで解の妥当性を堅牢に判別します;(2)推論において、再サンプリングによる拒否を可能にし、複雑な推論課題に計算資源を効果的に集中させます;そして(3)アラインメントにおいて、疎な結果スーパービジョンをきめ細かな指針へと変換する密な幾何学的報酬として機能し、モデルが標準的なベースラインを超えて自己発展できるようにします。本結果は、dLLMの正しさの頑健な指標として、内在する幾何学的安定性を確立します。