Tag: edge-inference
All the articles with the tag "edge-inference".
- 7.7
DyMoE:MoE 模型边缘推理的动态混合精度框架,TTFT 加速最高 22.7 倍
通过重要性感知的动态量化和深度自适应调度,在商业边缘硬件上实现 MoE 模型的实时推理
All the articles with the tag "edge-inference".
通过重要性感知的动态量化和深度自适应调度,在商业边缘硬件上实现 MoE 模型的实时推理