Tag: inference
All the articles with the tag "inference".
-
6.5 Google 正式将 TensorFlow Lite 重命名为 LiteRT,同步新增 GenAI 支持,定位为跨 Android/iOS/嵌入式平台的统一高性能 ML 运行时,目标是让 LLM 量化模型在边缘侧无缝部署。
→ 原文链接
-
8.5 苹果今日发布搭载 M5 / M5 Pro / M5 Max 芯片的全新 MacBook Air 与 MacBook Pro,最大亮点是 GPU 架构革新——每个核心配备独立 Neural Accelerator,LLM prompt 处理速度较上代提升最高 4 倍。
→ 原文链接
-
8.5 Percepta AI 提出全新架构:将程序直接编码进 Transformer 权重中执行,无需传统计算硬件,推理速度可达指数级加速。Hacker News 排名第一。
→ 原文链接