Skip to content
星际流动

DIVERSED: Relaxed Speculative Decoding via Dynamic Ensemble Verification

发布
采集
学术前沿 7.5 分 — 松弛推测解码:动态集成验证放宽严格匹配限制接受合理token,提升接受率和加速比,对LLM推理加速有显著工程价值。
原文: arxiv.org

评分 7.5 · 来源: · 发布于 2026-04-10

评分依据:松弛推测解码:动态集成验证放宽严格匹配限制接受合理token,提升接受率和加速比,对LLM推理加速有显著工程价值。