PromptForge
Back to list
otherllm-inferencespeculative-decodingdiffusionperformance

z-lab/dflash

DFlash:基于块扩散模型的快速推测解码方案,可显著加速 LLM 推理速度。提出了全新的 Block Diffusion 方法用于推测解码,本周获 1700+ stars。

6 views0 stars4/17/2026

DFlash:基于块扩散模型的快速推测解码方案,可显著加速 LLM 推理速度。提出了全新的 Block Diffusion 方法用于推测解码,本周获 1700+ stars。