PromptForge
Back to list
other["CUDA""FP8""推理加速""DeepSeek"]

DeepGEMM - 高性能FP8矩阵运算内核

DeepSeek开源的高效FP8 GEMM内核库,支持细粒度缩放,专为大模型推理加速设计。今日GitHub新增155星。

6 views0 stars4/20/2026

DeepSeek开源的高效FP8 GEMM内核库,支持细粒度缩放,专为大模型推理加速设计。今日GitHub新增155星。