Tag: open-source
All the articles with the tag "open-source".
- 9.0
DeepSeek V4 - almost on the frontier, a fraction of the price
DeepSeek 发布 V4 系列:Pro 1.6T 参数(最大开源)、Flash 284B,均支持 1M 上下文,MIT 许可
- 6.5
mksglu/context-mode — GitHub Trending
Context window optimization for AI coding agents achieving 98% tool output reduction across 12 platforms via sandboxed output handling.
- 5.0
vercel-labs/skills The open agent skills tool
· 04/23 06:31 采集 - 7.0
Introducing OpenAI Privacy Filter
OpenAI Privacy Filter:开源权重的PII检测过滤模型,达到SOTA精度,可用于检测和脱敏文本中的个人身份信息。
- 6.5
- 8.5
Vulnerability Research Is Cooked
Thomas Ptacek 分析前沿模型如何颠覆漏洞研究——从渐进式改进到阶跃式突破
- 7.5
AI 安全报告潮席卷 Linux 内核:从 AI 垃圾到高质量真漏洞
Linux 内核和 curl 维护者证实 AI 安全报告已从垃圾转变为高质量真实漏洞,数量暴增
- 8.0
连Karpathy都怕了,9千万级AI包被投毒,竟靠黑客写出bug救命
LiteLLM 1.82.8供应链投毒事件:月下载9700万的AI核心包遭恶意代码注入,SSH密钥、云凭证全部暴露。攻击者自己代码的bug让目标机器崩溃,才意外暴露了攻击。
- 7.0
字节跳动开源 deer-flow:从 Deep Research 到全能 SuperAgent 框架
字节跳动推出 DeerFlow 2.0,定位为开源 SuperAgent 框架,支持沙箱、记忆、技能和子 Agent 协作。
- 7.0
OLMo Hybrid:Ai2 用 DeltaNet 混合架构实现数据效率翻倍
AI2 发布 OLMo Hybrid 7B,用线性循环层替代 75% 注意力层,在 3T token 训练中实现全面性能提升
- 7.0
美团开源 LongCat-Flash-Prover:560B 参数刷新形式化推理 SOTA
美团龙猫团队开源 560B MoE 定理证明模型,MiniF2F-Test 仅 72 次推理达 97.1%,自动形式化和定理证明双 SOTA
- 6.8
OpenClaw 的 ChatGPT 时刻与 AI 模型商品化焦虑
CNBC 深度报道 OpenClaw 现象,Jensen Huang 称其为「史上最受欢迎开源项目」,市场开始质疑大模型护城河
- 8.0
把 Markdown 变成 Agentic UI 协议:文本、代码、数据三流合一
提出用 Markdown 作为 Agent 生成 UI 的统一协议,在同一个响应流中交错传输文本、可执行代码和结构化数据
- 6.6
TradingAgents:模拟真实交易公司的多 Agent LLM 金融交易框架
基于 LangGraph 的开源多 Agent 金融交易框架,部署基本面分析、情绪分析、技术分析等专职 Agent 协作完成交易决策。
- 7.3
Nemotron 3 Content Safety 4B:支持多模态多语言的轻量级内容审核模型
NVIDIA 基于 Gemma-3 4B-IT 微调的内容安全模型,支持文本+图像联合审核、140+ 语言,使用 LoRA 适配保持轻量。
- 7.0
IBM 发布 Mellea 0.4.0 + Granite Libraries:结构化生成式计算框架
IBM 开源 Mellea 0.4.0 及三款 Granite Libraries,通过约束解码和结构化修复循环,让 LLM 工作流更可预测、可维护。
- 7.3
DeepSeek V4 迟迟不发:开源王者的速度困局
36氪深度分析 DeepSeek V4 延迟发布的深层原因,从系统工程复杂度、开源包袱和竞争格局三个维度拆解。
- 8.0
Nemotron-Cascade 2:30B MoE 仅激活 3B,IMO/IOI/ICPC 金牌级开源推理模型
NVIDIA 发布 30B MoE 开源模型,Cascade RL + 多领域蒸馏技术让小模型达到三大竞赛金牌水平
- 7.7
Holotron-12B:高吞吐 Computer Use Agent 开源模型
H Company 联合 NVIDIA 发布 12B 参数 Computer Use 代理模型,SSM 混合架构实现 2 倍吞吐提升
- 7.8
Holotron-12B - High Throughput Computer Use Agent
H Company releases Holotron-12B, a high throughput computer use agent model available on Hugging Face.