评分 8.5 · 来源:GitHub Trending · 发布于 2026-04-18
评分依据:DeepSeek开源高性能FP8 GEMM内核,细粒度scaling策略,6400+星。对推理优化社区有显著贡献,直接提升FP8训练/推理效率。工程价值高。
deepseek-ai/DeepGEMM: DeepGEMM: clean and efficient FP8 GEMM kernels with fine-grained scaling
原文: GitHub Trending
评分 8.5 · 来源:GitHub Trending · 发布于 2026-04-18
评分依据:DeepSeek开源高性能FP8 GEMM内核,细粒度scaling策略,6400+星。对推理优化社区有显著贡献,直接提升FP8训练/推理效率。工程价值高。