LaDiR:潜在拡散でLLMのテキスト推論を強化

Apple Machine Learning Journal / 2026/4/28

📰 ニュースIdeas & Deep AnalysisModels & Research

要点

  • LaDiR(Latent Diffusion Reasoner)は、LLMのテキスト推論に潜在拡散モデルの「反復的な洗練」能力を統合する新しい推論フレームワークを提案しています。
  • 通常の自己回帰的デコードでは初期トークンを全体的に見直して改善するのが難しく、探索が非効率になり得るという課題を指摘しています。
  • LaDiRでは、連続的な潜在表現の表現力と、潜在拡散モデルの反復リファインメントを同一枠組みで結び付け、既存LLMの推論性能を高めることを目指します。
  • 構造化された潜在推論空間を構築し、そこに対して拡散にもとづく反復更新を行う設計が示されています。
Large Language Models (LLMs) demonstrate their reasoning ability through chain-of-thought (CoT) generation. However, LLM’s autoregressive decoding may limit the ability to revisit and refine earlier tokens in a holistic manner, which can also lead to inefficient exploration for diverse solutions. In this paper, we propose LaDiR (Latent Diffusion Reasoner), a novel reasoning framework that unifies the expressiveness of continuous latent representation with the iterative refinement capabilities of latent diffusion models for an existing LLM. We first construct a structured latent reasoning space…

この記事の続きは原文サイトでお読みいただけます。

原文を読む →