GeoBlock: 拡散言語モデルにおける依存関係ジオメトリからブロック粒度を推論する
arXiv cs.CL / 2026/3/31
📰 ニュースSignals & Early TrendsIdeas & Deep AnalysisModels & Research
要点
- GeoBlock は、固定されたスケジュールや経験則ではなく、注意(attention)から得られる依存関係ジオメトリに基づいて最適なブロック粒度を導出する、拡散言語モデル向けの幾何学認識型ブロック推論フレームワークである。
- 本手法は、強い因果的順序を持つトークン領域(逐次更新が必要)と、意味的にまとまりのある領域(並列での洗練=refinement が可能)を区別し、復号(decoding)中にブロック境界を動的に設定する。
- GeoBlock は、ブロック拡散の並列効率を維持しつつ、依存関係に整合した洗練を強制することで、自己回帰的な信頼性を向上させる。
- 本アプローチは追加の学習を必要とせず、既存のブロック拡散アーキテクチャに統合できる。
- 複数のベンチマークに対する実験では、GeoBlock が、幾何学的に整合したブロック境界を確実に同定しつつ、計算コストのわずかな追加のみでブロック拡散の精度を改善することが報告されている。




