模型动态

55 篇文章

5.0
Marco-MoE: Open Multilingual Mixture-of-Expert Language Models with Efficient Upcycling
2026年04月29日
· arXiv cs.CL· 04/29 14:31 采集
完全开源多语言稀疏 MoE 模型套件，约 5% 参数激活，5T token 高效预训练
9.0
DeepSeek V4 - almost on the frontier, a fraction of the price
2026年04月24日
· Simon Willison· 04/24 08:00 采集
DeepSeek 发布 V4 系列：Pro 1.6T 参数（最大开源）、Flash 284B，均支持 1M 上下文，MIT 许可
8.5
A pelican for GPT-5.5 via the semi-official Codex backdoor API
2026年04月24日
· Simon Willison's Weblog· 04/24 08:32 采集
GPT-5.5 正式发布，已登陆 OpenAI Codex 并逐步向付费 ChatGPT 用户推出，API 部署尚需安全准备
8.0
Introducing GPT-5.5
2026年04月23日
· OpenAI· 04/24 08:00 采集
OpenAI 发布 GPT-5.5：更快、更强，专为复杂任务如编码、研究和数据分析打造
6.0
GPT-5.5 System Card
2026年04月23日
· OpenAI· 04/24 08:00 采集
GPT-5.5 System Card：完整的安全评估和能力边界说明
5.0
ChatGPT's new Images 2.0 model is surprisingly good at generating text
2026年04月22日
· TechCrunch· 04/22 04:32 采集
6.8
A new way to explore the web with AI Mode in Chrome
2026年04月17日
· Google Blog
Google 在 Chrome 浏览器中推出 AI Mode 升级，将 AI 搜索能力深度集成到网页浏览体验中。
6.5
Gemini can now pull from Google Photos to generate personalized images
2026年04月17日
· The Verge· 04/17 06:31 采集
Gemini Personal Intelligence 现可调用 Google Photos 数据，配合 Nano Banana 2 模型生成基于个人上下文的个性化图片
6.2
New ways to create personalized images in the Gemini app
2026年04月17日
· Google Blog
Gemini 应用推出 Nano Banana 2 个性化图像生成功能，利用个人上下文和 Google Photos 创建定制图片。
7.2
Anthropic releases a new Opus model amid Mythos Preview buzz
2026年04月16日
· The Verge· 04/17 06:31 采集
Anthropic 发布迄今最强 GA 模型 Claude Opus 4.7，在复杂软件工程、图像分析和指令遵循方面超越 Opus 4.6
7.0
Meta 发布 Muse Spark：Superintelligence Labs 首个模型，覆盖全产品线
2026年04月09日
· AI | The Verge· 04/09 06:31 采集
Meta Superintelligence Labs 发布重组后首个模型 Muse Spark，已上线 Meta AI 应用及网站，未来数周将覆盖 WhatsApp、Instagram、Facebook、Messenger 和智能眼镜
7.2
Anthropic 发布 Claude Mythos Preview：联合 Nvidia/Google/Apple 等启动网络安全计划 Project Glasswing
2026年04月08日
· AI | The Verge· 04/08 02:32 采集
Anthropic 推出专为安全漏洞发现设计的新模型 Claude Mythos Preview，与六大科技巨头联合启动 Project Glasswing 网络安全项目，几乎无需人工干预即可标记系统漏洞
6.8
Arcee：26 人小团队的开源大模型为何让 OpenClaw 社区着迷
2026年04月07日
· TechCrunch· 04/08 10:35 采集
仅 26 人的美国初创公司 Arcee 打造出高性能开源大模型，在 OpenClaw 用户群体中快速走红，证明小团队也能在开源模型领域突围
8.5
Gemma 4：Google 发布最强开源模型系列，前端多模态能力设备端可用
2026年04月03日
· Google DeepMind Blog· 04/03 18:31 采集
Google DeepMind 发布 Gemma 4 系列开源模型，涵盖 1B/4B/12B/27B 四个参数规模，支持原生多模态输入输出，在同等参数量下达到前沿性能，27B 版本支持设备端运行。
6.5
微软发布三款全新基础模型，正面挑战 OpenAI 和 Anthropic
2026年04月03日
· TechCrunch· 04/03 18:31 采集
微软推出三款自研 MAI 系列基础模型，减少对 OpenAI 的依赖。
6.0
下载量暴跌65%，Sora 为何成了 OpenAI 的弃子？
2026年03月27日
· 虎嗅· 03/27 16:32 采集
OpenAI宣布关闭Sora产品，下载量暴跌65%，曾让好莱坞颤抖的AI视频生成工具最终沦为弃子。
7.0
前阿里千问负责人林俊旸离职首发长文：从推理式思考到智能体思考
2026年03月27日
· 36氪· 03/27 16:32 采集
原阿里通义千问技术负责人林俊旸辞职后首发长文，系统性复盘推理模型阶段特征，探讨AI未来方向：从训练模型转向训练智能体。
7.0
字节跳动Helios：单卡H100实时生成分钟级视频，打破AI视频不可能三角
2026年03月27日
· 36氪· 03/27 14:32 采集
北京大学与字节跳动联合推出的Helios大模型，14B参数在单张H100上以19.53FPS运行，画质接近Seedance 2.0级别，可连贯生成数分钟视频。
6.8
美团开源LongCat-Next：原生多模态架构统一图像、语音与文本Token
2026年03月27日
· 36氪· 03/27 14:32 采集
美团发布原生多模态大模型LongCat-Next及离散原生分辨率视觉分词器dNaViT，打破以语言为中心的拼凑式架构，通过纯NTP范式实现真正的多模态统一。
8.5
Intern-S1-Pro：首个万亿参数科学多模态基础模型
2026年03月27日
· cs.CL updates on arXiv.org· 03/27 12:31 采集
上海人工智能实验室发布首个万亿参数科学多模态基础模型，在通用和科学领域全面提升，掌握超过 100 个科学领域。

模型动态

Marco-MoE: Open Multilingual Mixture-of-Expert Language Models with Efficient Upcycling

DeepSeek V4 - almost on the frontier, a fraction of the price

A pelican for GPT-5.5 via the semi-official Codex backdoor API

Introducing GPT-5.5

GPT-5.5 System Card

ChatGPT's new Images 2.0 model is surprisingly good at generating text

A new way to explore the web with AI Mode in Chrome

Gemini can now pull from Google Photos to generate personalized images

New ways to create personalized images in the Gemini app

Anthropic releases a new Opus model amid Mythos Preview buzz

Meta 发布 Muse Spark：Superintelligence Labs 首个模型，覆盖全产品线

Anthropic 发布 Claude Mythos Preview：联合 Nvidia/Google/Apple 等启动网络安全计划 Project Glasswing

Arcee：26 人小团队的开源大模型为何让 OpenClaw 社区着迷

Gemma 4：Google 发布最强开源模型系列，前端多模态能力设备端可用

微软发布三款全新基础模型，正面挑战 OpenAI 和 Anthropic

下载量暴跌65%，Sora 为何成了 OpenAI 的弃子？

前阿里千问负责人林俊旸离职首发长文：从推理式思考到智能体思考

字节跳动Helios：单卡H100实时生成分钟级视频，打破AI视频不可能三角

美团开源LongCat-Next：原生多模态架构统一图像、语音与文本Token

Intern-S1-Pro：首个万亿参数科学多模态基础模型