Skip to content
星际流动

deepseek-ai/DeepGEMM: DeepGEMM: clean and efficient FP8 GEMM kernels with fine-grained scaling

发布
采集
算力硬件 8.5 分 — DeepSeek开源高性能FP8 GEMM内核,细粒度scaling策略,6400+星。对推理优化社区有显著贡献,直接提升FP8训练/推理效率。工程价值高。
原文: GitHub Trending

评分 8.5 · 来源:GitHub Trending · 发布于 2026-04-18

评分依据:DeepSeek开源高性能FP8 GEMM内核,细粒度scaling策略,6400+星。对推理优化社区有显著贡献,直接提升FP8训练/推理效率。工程价值高。