评分依据:DeepSeek 开源的 FP8 GEMM 内核库,针对推理性能优化。FP8 量化是当前 LLM 推理优化的关键技术方向,细粒度缩放设计具有工程参考价值。对从事模型推理优化的开发者有较高的实用价值。
DeepGEMM
发布
采集
工程实践 7.5 分
— DeepSeek 开源的 FP8 GEMM 内核库,针对推理性能优化。FP8 量化是当前 LLM 推理优化的关键技术方向,细粒度缩放设计具有工程参考价值。对从事模型推理优化的开发者有较高的实用价值。