评分 9 · 来源:Simon Willison · 发布于 2026-04-24
评分依据:DeepSeek V4 系列首发:1.6T 总参数量(最大开源模型)、100 万上下文、MIT 许可。对开源 AI 格局影响重大,信息密度极高。
DeepSeek 发布了备受期待的 V4 系列首批预览模型——DeepSeek-V4-Pro 和 DeepSeek-V4-Flash。
核心规格
- V4-Pro: 1.6T 总参数量,49B 活跃参数,1M token 上下文
- V4-Flash: 284B 总参数量,13B 活跃参数,1M token 上下文
- 两者均为 MoE 架构,采用 MIT 许可证
行业影响
DeepSeek-V4-Pro 成为当前最大的开源权重模型,超过 Kimi K2.6(1.1T)和 GLM-5.1(754B),规模是 DeepSeek V3.2(685B)的两倍以上。Pro 模型权重约 865GB。
这是继去年 12 月 V3.2 / V3.2 Speciale 之后 DeepSeek 的首次重大模型发布,标志着开源 AI 领域进入新的参数规模竞争阶段。