PromptForge
Back to list
otherinferencespeculative-decodingdiffusionllmpython

DFlash

Block Diffusion加速推测解码框架,显著提升LLM推理速度。来自z-lab的最新研究,将扩散模型思想引入推测解码。

8 views0 stars4/16/2026

Block Diffusion加速推测解码框架,显著提升LLM推理速度。来自z-lab的最新研究,将扩散模型思想引入推测解码。