PromptForge
Back to list
otherspeculative-decodinginference-accelerationdiffusionLLMresearch

DFlash

基于块扩散模型的闪电推测解码框架,显著加速 LLM 推理速度,z-lab 团队的前沿推理加速研究项目

5 views0 stars4/18/2026

基于块扩散模型的闪电推测解码框架,显著加速 LLM 推理速度,z-lab 团队的前沿推理加速研究项目