Back to list
otherinferencespeculative-decodingdiffusionllmperformance
DFlash
Block Diffusion for Flash Speculative Decoding — 利用块扩散实现LLM推测解码加速,大幅提升推理速度的新方法。
5 views0 stars4/18/2026
Block Diffusion for Flash Speculative Decoding — 利用块扩散实现LLM推测解码加速,大幅提升推理速度的新方法。