Back to list
otherinferencespeculative-decodingdiffusionllmpython
DFlash
Block Diffusion加速推测解码框架,显著提升LLM推理速度。来自z-lab的最新研究,将扩散模型思想引入推测解码。
7 views0 stars4/16/2026
Block Diffusion加速推测解码框架,显著提升LLM推理速度。来自z-lab的最新研究,将扩散模型思想引入推测解码。
Block Diffusion加速推测解码框架,显著提升LLM推理速度。来自z-lab的最新研究,将扩散模型思想引入推测解码。
Block Diffusion加速推测解码框架,显著提升LLM推理速度。来自z-lab的最新研究,将扩散模型思想引入推测解码。