评分 5 · 来源:arXiv cs.LG · 发布于 2026-04-29
评分依据:硬件在环架构搜索设计端侧 LLM,面向工业级延迟约束
实时 AI 体验需要针对资源受限硬件优化的端侧 LLM。最有用的 OD-LLMs 产生近实时响应且具有广泛硬件兼容性。本文提出硬件在环架构搜索方法论设计此类模型。
评分 5 · 来源:arXiv cs.LG · 发布于 2026-04-29
评分依据:硬件在环架构搜索设计端侧 LLM,面向工业级延迟约束
实时 AI 体验需要针对资源受限硬件优化的端侧 LLM。最有用的 OD-LLMs 产生近实时响应且具有广泛硬件兼容性。本文提出硬件在环架构搜索方法论设计此类模型。