评分 7.5 · 来源: · 发布于 2026-04-10 评分依据:松弛推测解码:动态集成验证放宽严格匹配限制接受合理token,提升接受率和加速比,对LLM推理加速有显著工程价值。
评分 7.5 · 来源: · 发布于 2026-04-10
评分依据:松弛推测解码:动态集成验证放宽严格匹配限制接受合理token,提升接受率和加速比,对LLM推理加速有显著工程价值。