模型动态
55 篇文章
- 5.0
Marco-MoE: Open Multilingual Mixture-of-Expert Language Models with Efficient Upcycling
完全开源多语言稀疏 MoE 模型套件,约 5% 参数激活,5T token 高效预训练
- 9.0
DeepSeek V4 - almost on the frontier, a fraction of the price
DeepSeek 发布 V4 系列:Pro 1.6T 参数(最大开源)、Flash 284B,均支持 1M 上下文,MIT 许可
- 8.5
A pelican for GPT-5.5 via the semi-official Codex backdoor API
GPT-5.5 正式发布,已登陆 OpenAI Codex 并逐步向付费 ChatGPT 用户推出,API 部署尚需安全准备
- 8.0
- 6.0
- 5.0
- 6.8
A new way to explore the web with AI Mode in Chrome
Google 在 Chrome 浏览器中推出 AI Mode 升级,将 AI 搜索能力深度集成到网页浏览体验中。
- 6.5
Gemini can now pull from Google Photos to generate personalized images
Gemini Personal Intelligence 现可调用 Google Photos 数据,配合 Nano Banana 2 模型生成基于个人上下文的个性化图片
- 6.2
New ways to create personalized images in the Gemini app
Gemini 应用推出 Nano Banana 2 个性化图像生成功能,利用个人上下文和 Google Photos 创建定制图片。
- 7.2
Anthropic releases a new Opus model amid Mythos Preview buzz
Anthropic 发布迄今最强 GA 模型 Claude Opus 4.7,在复杂软件工程、图像分析和指令遵循方面超越 Opus 4.6
- 7.0
Meta 发布 Muse Spark:Superintelligence Labs 首个模型,覆盖全产品线
Meta Superintelligence Labs 发布重组后首个模型 Muse Spark,已上线 Meta AI 应用及网站,未来数周将覆盖 WhatsApp、Instagram、Facebook、Messenger 和智能眼镜
- 7.2
Anthropic 发布 Claude Mythos Preview:联合 Nvidia/Google/Apple 等启动网络安全计划 Project Glasswing
Anthropic 推出专为安全漏洞发现设计的新模型 Claude Mythos Preview,与六大科技巨头联合启动 Project Glasswing 网络安全项目,几乎无需人工干预即可标记系统漏洞
- 6.8
Arcee:26 人小团队的开源大模型为何让 OpenClaw 社区着迷
仅 26 人的美国初创公司 Arcee 打造出高性能开源大模型,在 OpenClaw 用户群体中快速走红,证明小团队也能在开源模型领域突围
- 8.5
Gemma 4:Google 发布最强开源模型系列,前端多模态能力设备端可用
Google DeepMind 发布 Gemma 4 系列开源模型,涵盖 1B/4B/12B/27B 四个参数规模,支持原生多模态输入输出,在同等参数量下达到前沿性能,27B 版本支持设备端运行。
- 6.5
微软发布三款全新基础模型,正面挑战 OpenAI 和 Anthropic
微软推出三款自研 MAI 系列基础模型,减少对 OpenAI 的依赖。
- 6.0
下载量暴跌65%,Sora 为何成了 OpenAI 的弃子?
OpenAI宣布关闭Sora产品,下载量暴跌65%,曾让好莱坞颤抖的AI视频生成工具最终沦为弃子。
- 7.0
前阿里千问负责人林俊旸离职首发长文:从推理式思考到智能体思考
原阿里通义千问技术负责人林俊旸辞职后首发长文,系统性复盘推理模型阶段特征,探讨AI未来方向:从训练模型转向训练智能体。
- 7.0
字节跳动Helios:单卡H100实时生成分钟级视频,打破AI视频不可能三角
北京大学与字节跳动联合推出的Helios大模型,14B参数在单张H100上以19.53FPS运行,画质接近Seedance 2.0级别,可连贯生成数分钟视频。
- 6.8
美团开源LongCat-Next:原生多模态架构统一图像、语音与文本Token
美团发布原生多模态大模型LongCat-Next及离散原生分辨率视觉分词器dNaViT,打破以语言为中心的拼凑式架构,通过纯NTP范式实现真正的多模态统一。
- 8.5
Intern-S1-Pro:首个万亿参数科学多模态基础模型
上海人工智能实验室发布首个万亿参数科学多模态基础模型,在通用和科学领域全面提升,掌握超过 100 个科学领域。