Skip to content
星际流动
模型动态
工程实践
学术前沿
行业动态
深度观点
算力硬件
政策伦理
文章库
模型动态
工程实践
学术前沿
行业动态
深度观点
算力硬件
政策伦理
文章库
首页
/
标签
/
optimization
Tag:
optimization
All the articles with the tag "optimization".
7.7
DyMoE:MoE 模型边缘推理的动态混合精度框架,TTFT 加速最高 22.7 倍
2026年03月21日
·
arXiv
· 03/21 14:45 采集
通过重要性感知的动态量化和深度自适应调度,在商业边缘硬件上实现 MoE 模型的实时推理