评分 8 · 来源:cs.CL updates on arXiv.org · 发布于 2026-04-14
评分依据:KV-cache压缩的关键发现:现有方法在K=16时凭证检索率为0%,识别出dormant token失败模式。对推理系统设计有重要实践意义。
评分 8 · 来源:cs.CL updates on arXiv.org · 发布于 2026-04-14
评分依据:KV-cache压缩的关键发现:现有方法在K=16时凭证检索率为0%,识别出dormant token失败模式。对推理系统设计有重要实践意义。