Skip to content
星际流动

z-lab / dflash

发布
采集
工程实践 6.0 分 — Block Diffusion 用于 Flash Speculative Decoding 是推理加速方向的技术创新,183 stars/day 增长不错。
原文: GitHub Trending

评分 6.0 · 来源:GitHub Trending · 发布于 2026-04-16

评分依据:Block Diffusion 用于 Flash Speculative Decoding 是推理加速方向的技术创新,183 stars/day 增长不错。

DFlash 提出了一种基于 Block DiffusionFlash Speculative Decoding 方案,用于加速 LLM 推理。

项目数据:

Speculative Decoding(推测解码)是大模型推理加速的主流技术路线之一,而 DFlash 通过 Block Diffusion 机制进一步优化了该方案。对关注推理性能优化的工程师有参考价值。


标签: