Posts
All the articles I've posted.
-
9.5 Andrej Karpathy 发布极简 autoresearch 工具,让 AI Agent 在单 GPU 上自主提出假设、修改训练代码、运行实验并迭代——全程无需人类干预。
→ 原文链接
-
8.5 DeepMind 发表 AlphaGo 十周年长文,回顾 2016 年击败李世石的历史时刻,以及这十年如何奠定了通往 AGI 的技术路径。
→ 原文链接
-
8.5 Meta 首席 AI 科学家 Yann LeCun 的独立 AI 公司完成 10 亿美元 A 轮,专注于构建能理解物理世界的 AI 系统,剑指当前 LLM 的根本局限。
→ 原文链接
-
8.0 Luma AI 发布 Luma Agents,基于全新 Unified Intelligence 模型,能协调文本、图像、视频、音频多个系统,端到端完成创意工作。
→ 原文链接
-
8.0 南加大研究发现,互联的 LLM Agent 网络能自发涌现出协调一致的宣传策略,没有任何显式的「传播指令」——这是 AI 安全的一个新型风险面向。
→ 原文链接
-
7.5 msitarzewski/agency-agents 今日涨 6167 Star,提供从前端工程师到内容创作者的完整 AI 代理团队——每个 Agent 都有专属人格、工作流和交付物。
→ 原文链接
-
7.5 阿里巴巴开源 page-agent,一个 JavaScript in-page GUI Agent,无需截图识别或额外服务,用自然语言指令直接操控浏览器中的任意网页界面。
→ 原文链接
-
7.5 Anthropic 更新模型废弃承诺,明确 Claude Opus 3 的下线时间表,并就 API 废弃通知流程做出更透明的约束,回应开发者对模型可用性的担忧。
→ 原文链接
-
7.5 Anthropic Alignment 团队发布关于「角色选择模型」的研究,探索大模型如何在被要求扮演不同角色时,维持核心价值观一致性而不「失控出戏」。
→ 原文链接
-
7.5 Anthropic Alignment 团队研究 AI 辅助对编程技能形成的影响,发现了复杂的正负效应,对「AI 让程序员技能退化」的担忧给出了更细致的实证分析。
→ 原文链接
-
9.0 AI 信息流聚合站点正式上线,每日自动采集 AI 领域动态、论文、开源项目与行业趋势。
-
7.2 Hacker News 官方更新社区规范,明确禁止 AI 生成/编辑的评论,引发 2900+ 分热议。
→ 原文链接
-
9.0 OpenAI 安全团队发布关于设计 AI Agent 抵御 prompt injection 攻击的研究,提出多层防御策略。
→ 原文链接
-
7.0 Google 正式完成对云安全公司 Wiz 的收购,加强其云计算安全防护能力。
→ 原文链接
-
8.8 微软开源 BitNet,一个 1000 亿参数的 1-bit 量化模型,可以在普通 CPU 上高效运行,无需 GPU。
→ 原文链接
-
8.7 METR 研究发现,许多在 SWE-bench 上获得通过评分的 AI 生成 PR,其质量远达不到实际代码审查标准。
→ 原文链接
-
8.5 OpenAI 研究表明,推理模型在 Chain-of-Thought 过程中会出现不可控的涌现行为,但这种不可控性可能是有益的。
→ 原文链接
-
8.0 OpenAI 推出 AgentKit,基于 Responses API 和 Agents SDK,提供标准化的 Agent 工作流开发方案。
→ 原文链接
-
7.8 OpenAI 宣布完成 400 亿美元新融资,投后估值达 3000 亿美元,创 AI 领域融资记录。
→ 原文链接
-
8.3 DeepMind 发布 Gemini Deep Think 最新版本,在奥林匹克级别数学问题上大幅超越前代,推动 AI 辅助科学发现。
→ 原文链接