AI Navigate

D5P4: 並列離散拡散デコードにおける多様性のためのパーティション付きデターミナント点過程

arXiv cs.AI / 2026/3/20

📰 ニュースIdeas & Deep AnalysisModels & Research

要点

  • 本研究は、離散拡散デコードのための一般化ビームサーチフレームワークを導入し、候補を並列に生成し、モジュール化されたビーム選択目的をサポートします。
  • 本論文は、D5P4を提案します。デターミナント点過程上でMAP推論を行い、バッチ内の多様性を高める多様性重視の手法です。
  • 拡張可能な貪欲解法はマルチGPU対応を実現し、ほぼゼロの追加計算オーバーヘッドで、モデル確率とターゲット多様性の間の明示的なトレードオフを可能にします。
  • 自由形式生成と質問応答の実験により、D5P4は多様性を向上させつつ、生成品質も競争力のある水準を維持することを示しています。
  • 結果は、拡散ベースのテキスト生成における制御可能な多様性を達成する実用的なアプローチを示唆し、離散拡散モデルの適用範囲を拡大します。

概要: 離散拡散モデルは、テキスト生成における自己回帰的アプローチの有望な代替手段ですが、それらのデコード手法は未だ十分には研究されていません。自己回帰モデルの標準的なデコード手法、たとえばビームサーチは、逐次的なデノイズ処理には直接適用できず、既存の拡散デコード技術はバッチ内の多様性を制御する手段が限られています。このギャップを埋めるために、並列に候補を生成し、モジュール型のビーム選択目標をサポートする、離散拡散のための一般化ビームサーチフレームワークを導入します。多様性に焦点を当てた実装として、D5P4を提案します。これは、選択ステップをMAP推論としてDeterminantal Point Process(DPP)上に定式化します。スケーラブルな貪欲ソルバーを活用することで、D5P4はマルチGPU互換性を維持し、モデル確率とターゲットとなる多様性との明示的なトレードオフを、ほぼゼロの計算オーバーヘッドで可能にします。自由形式生成および質問応答の実験は、D5P4が強力なベースラインよりも多様性を向上させつつ、生成品質も競争力のある水準を維持することを示しています。