自己回帰チェーンを打ち破る:LLMベース属性値抽出のための高並列デコーディング
arXiv cs.AI / 2026/4/30
💬 オピニオンDeveloper Stack & InfrastructureIdeas & Deep AnalysisModels & Research
要点
- 属性値抽出(AVE)では、同一の入力文脈から複数の独立した出力系列を生成する必要がある場合があるが、通常の自己回帰デコーディングはトークン生成を逐次に行うため遅い。
- 論文は、バッチ間の並列化や共用メモリ/計算を活用してオフラインLLMデコーディングを高速化するデコーディング手法「Hyper-Parallel Decoding(HPD)」を提案する。
- HPDは、位置IDの操作によりトークン生成を順不同にできることで効率を高め、各プロンプト内での独立した値生成を並列化できる。
- AVEでの実験では、属性値ペアが条件付きに独立であることが示され、さらに1つのプロンプトに複数文書を積み重ねることで、1プロンプトあたり最大96トークンの並列デコードが可能になる。
- 出力品質を損なうことなく、推論コストと総推論時間を最大13.8倍削減できるほか、独立した出力構造を持つ他のシナリオにも理論上適用できる可能性がある。



