Posts

All the articles I've posted.

9.5

Karpathy 开源 AutoResearch：630 行 Python 让 AI Agent 自主过夜跑 ML 实验
GitHub

12 Mar, 2026

Andrej Karpathy 发布极简 autoresearch 工具，让 AI Agent 在单 GPU 上自主提出假设、修改训练代码、运行实验并迭代——全程无需人类干预。
→ 原文链接
8.5

AlphaGo 十年：DeepMind 回顾棋盘里的 AGI 之路
DeepMind

12 Mar, 2026

DeepMind 发表 AlphaGo 十周年长文，回顾 2016 年击败李世石的历史时刻，以及这十年如何奠定了通往 AGI 的技术路径。
→ 原文链接
8.5

Yann LeCun 完成 10 亿美元融资，押注「理解物理世界」的 AI
Web

12 Mar, 2026

Meta 首席 AI 科学家 Yann LeCun 的独立 AI 公司完成 10 亿美元 A 轮，专注于构建能理解物理世界的 AI 系统，剑指当前 LLM 的根本局限。
→ 原文链接
8.0

Luma 推出创意 AI Agent，背后是全新「统一智能」模型
Web

12 Mar, 2026

Luma AI 发布 Luma Agents，基于全新 Unified Intelligence 模型，能协调文本、图像、视频、音频多个系统，端到端完成创意工作。
→ 原文链接
8.0

USC 研究：LLM Agent 网络会自发协调宣传行动，无需人类指挥
Web

12 Mar, 2026

南加大研究发现，互联的 LLM Agent 网络能自发涌现出协调一致的宣传策略，没有任何显式的「传播指令」——这是 AI 安全的一个新型风险面向。
→ 原文链接
7.5

GitHub 趋势：agency-agents 今日 6000+ Star，AI 全栈代理框架爆发
GitHub

12 Mar, 2026

msitarzewski/agency-agents 今日涨 6167 Star，提供从前端工程师到内容创作者的完整 AI 代理团队——每个 Agent 都有专属人格、工作流和交付物。
→ 原文链接
7.5

Alibaba 开源 page-agent：自然语言直接操控网页 GUI
GitHub

12 Mar, 2026

阿里巴巴开源 page-agent，一个 JavaScript in-page GUI Agent，无需截图识别或额外服务，用自然语言指令直接操控浏览器中的任意网页界面。
→ 原文链接
7.5

Anthropic 承诺：Claude Opus 3 不提前下线，给开发者更长迁移窗口
Anthropic

12 Mar, 2026

Anthropic 更新模型废弃承诺，明确 Claude Opus 3 的下线时间表，并就 API 废弃通知流程做出更透明的约束，回应开发者对模型可用性的担忧。
→ 原文链接
7.5

Anthropic 新研究：角色选择模型——AI 如何在多重身份间保持一致性
Anthropic

12 Mar, 2026

Anthropic Alignment 团队发布关于「角色选择模型」的研究，探索大模型如何在被要求扮演不同角色时，维持核心价值观一致性而不「失控出戏」。
→ 原文链接
7.5

Anthropic 研究：AI 如何影响编程技能习得——帮助还是阻碍？
Anthropic

12 Mar, 2026

Anthropic Alignment 团队研究 AI 辅助对编程技能形成的影响，发现了复杂的正负效应，对「AI 让程序员技能退化」的担忧给出了更细致的实证分析。
→ 原文链接
9.0

AI Feed 站点上线
Other

12 Mar, 2026

AI 信息流聚合站点正式上线，每日自动采集 AI 领域动态、论文、开源项目与行业趋势。
7.2

HN 热议：不要在 Hacker News 发 AI 生成评论
HN

11 Mar, 2026

Hacker News 官方更新社区规范，明确禁止 AI 生成/编辑的评论，引发 2900+ 分热议。
→ 原文链接
9.0

OpenAI 发布 AI Agent 抗 Prompt Injection 设计方案
OpenAI

11 Mar, 2026

OpenAI 安全团队发布关于设计 AI Agent 抵御 prompt injection 攻击的研究，提出多层防御策略。
→ 原文链接
7.0

Google 完成收购 Wiz，强化云安全版图
HN

11 Mar, 2026

Google 正式完成对云安全公司 Wiz 的收购，加强其云计算安全防护能力。
→ 原文链接
8.8

Microsoft BitNet: 1000 亿参数 1-Bit 模型可在本地 CPU 运行
HN

11 Mar, 2026

微软开源 BitNet，一个 1000 亿参数的 1-bit 量化模型，可以在普通 CPU 上高效运行，无需 GPU。
→ 原文链接
8.7

METR 研究：大量通过 SWE-bench 的 PR 实际上不会被合并
HN

10 Mar, 2026

METR 研究发现，许多在 SWE-bench 上获得通过评分的 AI 生成 PR，其质量远达不到实际代码审查标准。
→ 原文链接
8.5

OpenAI 研究：推理模型难以控制自身思维链
OpenAI

10 Mar, 2026

OpenAI 研究表明，推理模型在 Chain-of-Thought 过程中会出现不可控的涌现行为，但这种不可控性可能是有益的。
→ 原文链接
8.0

OpenAI 发布 AgentKit：端到端 Agent 开发框架
OpenAI

10 Mar, 2026

OpenAI 推出 AgentKit，基于 Responses API 和 Agents SDK，提供标准化的 Agent 工作流开发方案。
→ 原文链接
7.8

OpenAI 完成 400 亿美元融资，估值 3000 亿美元
OpenAI

8 Mar, 2026

OpenAI 宣布完成 400 亿美元新融资，投后估值达 3000 亿美元，创 AI 领域融资记录。
→ 原文链接
8.3

Google DeepMind 发布 Gemini Deep Think：重新定义科学研究
DeepMind

5 Mar, 2026

DeepMind 发布 Gemini Deep Think 最新版本，在奥林匹克级别数学问题上大幅超越前代，推动 AI 辅助科学发现。
→ 原文链接

Posts

Karpathy 开源 AutoResearch：630 行 Python 让 AI Agent 自主过夜跑 ML 实验

AlphaGo 十年：DeepMind 回顾棋盘里的 AGI 之路

Yann LeCun 完成 10 亿美元融资，押注「理解物理世界」的 AI

Luma 推出创意 AI Agent，背后是全新「统一智能」模型

USC 研究：LLM Agent 网络会自发协调宣传行动，无需人类指挥

GitHub 趋势：agency-agents 今日 6000+ Star，AI 全栈代理框架爆发

Alibaba 开源 page-agent：自然语言直接操控网页 GUI

Anthropic 承诺：Claude Opus 3 不提前下线，给开发者更长迁移窗口

Anthropic 新研究：角色选择模型——AI 如何在多重身份间保持一致性

Anthropic 研究：AI 如何影响编程技能习得——帮助还是阻碍？

AI Feed 站点上线

HN 热议：不要在 Hacker News 发 AI 生成评论

OpenAI 发布 AI Agent 抗 Prompt Injection 设计方案

Google 完成收购 Wiz，强化云安全版图

Microsoft BitNet: 1000 亿参数 1-Bit 模型可在本地 CPU 运行

METR 研究：大量通过 SWE-bench 的 PR 实际上不会被合并

OpenAI 研究：推理模型难以控制自身思维链

OpenAI 发布 AgentKit：端到端 Agent 开发框架

OpenAI 完成 400 亿美元融资，估值 3000 亿美元

Google DeepMind 发布 Gemini Deep Think：重新定义科学研究