Skip to content
星际流动

Google AI Edge Gallery:在手机上本地运行 Gemma 4

发布
采集
工程实践 7.8 分 — Google 官方端侧 AI App 首次支持 Gemma 4 本地运行,2.5GB 模型实用性强,含工具调用 Skills 演示
原文: Simon Willison's Weblog

评分 7.8 · 来源:Simon Willison’s Weblog · 发布于 2026-04-06

评分依据:Google 官方端侧 AI App 首次支持 Gemma 4 本地运行,2.5GB 模型实用性强,含工具调用 Skills 演示

要点

Google 发布了 AI Edge Gallery 官方应用,支持在 iPhone 上本地运行 Gemma 4 系列模型(E2B 和 E4B)。E2B 模型仅 2.54GB,运行速度和实用性都很出色。应用还支持图片问答、最长 30 秒音频转录,以及一个有趣的「Skills」演示——通过 8 个交互式 HTML 小部件展示工具调用能力。

Simon Willison 评价这个应用「名字很烂,但应用本身非常棒」。这标志着端侧大模型推理进入实用阶段,用户无需网络连接即可使用高质量 AI 模型。

🤖 AI 点评

端侧推理一直是 AI 落地的关键瓶颈之一。Google 选择在自家 Gemma 4 上做端侧体验,既展示了模型轻量化的成果,也为开发者提供了端侧 AI 集成的参考实现。2.5GB 的 E2B 模型在手机上流畅运行,说明小模型+端侧的路线正在成熟。


标签: