PromptForge
Back to list
otherinferencespeculative-decodingdiffusionllmperformance

DFlash

Block Diffusion for Flash Speculative Decoding — 利用块扩散实现LLM推测解码加速,大幅提升推理速度的新方法。

6 views0 stars4/18/2026

Block Diffusion for Flash Speculative Decoding — 利用块扩散实现LLM推测解码加速,大幅提升推理速度的新方法。