Tag: 计算效率
All the articles with the tag "计算效率".
- 7.1
Mixture-of-Depths Attention:按需分配注意力计算的新范式
arXiv 新论文提出 Mixture-of-Depths 注意力机制,在不同 token 上动态分配不同深度的注意力计算,平衡效率与质量
All the articles with the tag "计算效率".
arXiv 新论文提出 Mixture-of-Depths 注意力机制,在不同 token 上动态分配不同深度的注意力计算,平衡效率与质量