Tag: model-release
All the articles with the tag "model-release".
- 8.0
- 7.3
DeepSeek V4 迟迟不发:开源王者的速度困局
36氪深度分析 DeepSeek V4 延迟发布的深层原因,从系统工程复杂度、开源包袱和竞争格局三个维度拆解。
- 7.8
Holotron-12B:高吞吐量计算机使用 Agent
H Company 发布 Holotron-12B,专注于高吞吐量计算机操作的 AI Agent 模型
- 7.8
Holotron-12B - High Throughput Computer Use Agent
H Company releases Holotron-12B, a high throughput computer use agent model available on Hugging Face.
- 8.0
Introducing Mistral Small 4
Mistral releases 119B parameter Apache 2 licensed model unifying reasoning, multimodal, and agentic coding capabilities into a single model.
- 8.5
NVIDIA 发布 Nemotron 3 Super:120B 混合专家模型,专为 Agent 推理设计
120B 参数混合 Mamba-Transformer MoE 架构,1M context 窗口,开源权重,针对多 Agent 系统优化
- 7.5
Google 发布 Gemini 3.1 Flash-Lite:Gemini 系列最低价最快速模型
· DQ IndiaGoogle 推出 Gemini 3.1 Flash-Lite,输入价格仅 $0.25/M tokens,是 Gemini 3 系列中速度最快、成本最低的生产级模型,专为高并发开发者工作负载设计。
- 7.5
Meta 旗舰大模型 Avocado 推迟至五月发布
Meta CEO 扎克伯格力推的旗舰模型 Avocado 因性能问题推迟发布,原定三月上线,现推至至少五月。
- 8.5
NVIDIA 发布 Nemotron 3 Super:专为 Agentic AI 打造的 120B 开源混合架构模型
120B 总参数、12B 激活参数的 Mamba-Transformer MoE 混合模型,开放权重,推理吞吐量比同类高 5 倍,专门针对多智能体系统优化。
- 9.2
OpenAI 发布 GPT-5.4 Thinking 和 GPT-5.4 Pro:面向专业工作的最强前沿模型
· OpenAIOpenAI 正式推出 GPT-5.4 系列,包括 GPT-5.4 Thinking(集成思维链推理)和 GPT-5.4 Pro(最高质量选项),同步支持 1M token 上下文窗口,面向 Codex 和 API 全面开放。
- 7.5
Google 发布 Gemini 3.1 Flash Lite:最快最省钱的 Gemini 3 系列模型
Gemini 3.1 Flash Lite 于 3 月 3 日正式上线 Google AI Studio 和 Vertex AI,支持 1M token 上下文、多模态输入,速度比 2.5 Flash 快 2.5 倍。