PromptForge
Back to list
other推理加速Speculative DecodingLLMPython研究

DFlash

Block Diffusion 加速推测解码框架,将扩散模型思想引入 LLM 推理加速,实现并行 token 生成。前沿推理优化方案。

6 views0 stars4/24/2026

Block Diffusion 加速推测解码框架,将扩散模型思想引入 LLM 推理加速,实现并行 token 生成。前沿推理优化方案。