PromptForge
Back to list
otherinferencespeculative-decodingLLMacceleration

z-lab/dflash

DFlash: 基于块扩散的闪电推测解码技术,显著加速LLM推理速度。新一代推理加速方案,本周1.8K Star。

6 views0 stars4/18/2026

DFlash: 基于块扩散的闪电推测解码技术,显著加速LLM推理速度。新一代推理加速方案,本周1.8K Star。