Skip to content
星际流动

Transactional Attention: Semantic Sponsorship for KV-Cache Retention

发布
采集
学术前沿 8.0 分 — KV-cache压缩的关键发现:现有方法在K=16时凭证检索率为0%,识别出dormant token失败模式。对推理系统设计有重要实践意义。
原文: cs.CL updates on arXiv.org

评分 8 · 来源:cs.CL updates on arXiv.org · 发布于 2026-04-14

评分依据:KV-cache压缩的关键发现:现有方法在K=16时凭证检索率为0%,识别出dormant token失败模式。对推理系统设计有重要实践意义。