评分 7 · 来源: · 发布于 2026-04-10 评分依据:预算感知的MoE专家激活分配:在延迟约束下最小化性能损失,对MoE推理效率优化有工程价值。
评分 7 · 来源: · 发布于 2026-04-10
评分依据:预算感知的MoE专家激活分配:在延迟约束下最小化性能损失,对MoE推理效率优化有工程价值。