Back to list
other["CUDA""FP8""推理加速""DeepSeek"]
DeepGEMM - 高性能FP8矩阵运算内核
DeepSeek开源的高效FP8 GEMM内核库,支持细粒度缩放,专为大模型推理加速设计。今日GitHub新增155星。
6 views0 stars4/20/2026
DeepSeek开源的高效FP8 GEMM内核库,支持细粒度缩放,专为大模型推理加速设计。今日GitHub新增155星。
DeepSeek开源的高效FP8 GEMM内核库,支持细粒度缩放,专为大模型推理加速设计。今日GitHub新增155星。
DeepSeek开源的高效FP8 GEMM内核库,支持细粒度缩放,专为大模型推理加速设计。今日GitHub新增155星。