学术前沿

「学术前沿」分类下的所有文章

8.8
Anthropic 解构 LLM 人格空间——「助手轴」研究
2026年03月16日
· Anthropic Research
Anthropic 新研究从神经激活角度定义「助手轴」，揭示 LLM 人格漂移的内在机制，并提出激活限幅方案稳定模型行为。
7.8
AI Agent 研究周报：策略推理 vs 暴力搜索
2026年03月16日
· LLM Watch
本周 Agent 研究论文综述，涵盖推理能力、评估方法、安全风险和持续学习
7.5
大模型悖论：思考越久越诚实，但代价高昂
2026年03月16日
· 36氪
DeepMind 研究发现 AI 深度思考会提升诚实度，但这与追求速度和成本的商业逻辑形成尖锐冲突
7.5
LLM 评估：AI 的新瓶颈
2026年03月15日
· ML Frontiers· 03/16 18:32 采集
语言模型进步速度超过了我们可靠测量它们的能力，这正在成为一个问题
8.0
Google 研究提出贝叶斯教学法，让 LLM 学会概率推理更新
2026年03月15日
· InfoQ
Google 研究人员提出一种新训练方法，通过让大模型模拟最优贝叶斯系统的预测，使其具备随新证据动态更新信念的能力，解决了 LLM 推理僵化的核心问题。
8.5
Anthropic 研究揭示 AI 对劳动力市场的真实冲击：哪些职业最先受影响
2026年03月15日
· Euronews
Anthropic 发布基于真实 Claude 使用数据的劳动力市场研究，引入「观测暴露度」新指标，发现 AI 正优先渗透高薪专业岗位，而高暴露度职业的就业增速明显低于低暴露度职业。
8.5
Google DeepMind 发布 Aletheia：从数学竞赛迈向自主科研发现
2026年03月15日
· Google DeepMind / MarkTechPost
DeepMind 推出数学研究智能体 Aletheia，能够自主生成、验证和修正数学证明，从竞赛题解决者升级为专业研究员。
7.0
Tree Search Distillation：用 PPO 让语言模型学会「先搜后答」
2026年03月15日
· Hacker News / ayushtambde.com
研究者提出树搜索蒸馏方法，通过 PPO 将 MCTS 等树搜索过程内化到 LLM 推理中，推理时无需额外搜索即可受益。
8.0
AI 首次验证 Fields 奖获奖数学证明，New Scientist：数学正在经历史上最大变革
2026年03月13日
· New Scientist
AI 系统成功验证了 Maryna Viazovska 的球堆积问题证明（2022 Fields 奖），OpenAI 和 Google DeepMind 的 AI 模型也在尝试解决 First Proof 难题。
9.0
Claude Opus 4.6 两周内在 Firefox 发现 22 个安全漏洞，14 个高危
2026年03月13日
· Mozilla Blog
Mozilla 与 Anthropic Frontier Red Team 合作，用 Claude Opus 4.6 对 Firefox JavaScript 引擎进行安全审计，发现 22 个漏洞其中 14 个高危，AI 还为已修复漏洞生成了可工作的 exploit，全部已在 Firefox 148 中修复。
8.5
LLM 作为计算机——在 Transformer 内部执行程序，推理速度指数级提升
2026年03月13日
· Hacker News
Percepta AI 提出全新架构：将程序直接编码进 Transformer 权重中执行，无需传统计算硬件，推理速度可达指数级加速。Hacker News 排名第一。
8.5
Ai2 发布 MolmoBot：纯合成数据训练，零样本迁移到真实机器人
2026年03月13日
· Allen Institute for AI
Allen Institute for AI 开源 MolmoBot，首次实现无需真实数据的零样本 sim-to-real 迁移，模型已在真实机械臂上验证。
8.0
2026 年后训练技术全景：GRPO、DAPO、RLVR 如何取代 RLHF
2026年03月13日
· LLM Stats Research
深度综述 GRPO、DAPO、RLVR 等后训练方法如何成为主流，以及合成自博弈数据为何让 RLHF 退出历史舞台。
7.5
SWE-Bench 上 LLM 的 PR 合并率没有提高
2026年03月13日
· Entropic Thoughts
研究发现尽管 SWE-Bench 基准分数持续上升，LLM 生成的 PR 实际被合并进主分支的比例并未改善，暗示评测与现实脱节。
7.0
RAG 文档投毒攻击：攻击者如何悄悄腐蚀 AI 的知识源
2026年03月13日
· Amin RJ Blog
深度解析针对 RAG 系统的文档投毒攻击手法，包括语义隐藏、延迟触发和跨文档污染等高级技术。
7.5
Anthropic 研究：真实世界中 AI 使用的「去权力化」模式
2026年03月12日
· Anthropic
Anthropic 发布新研究，分析现实场景中 AI 助手如何可能在无意间强化用户的心理依赖与自主能力丧失，并探讨如何设计更赋权的 AI 交互。
7.0
Anthropic AI 流利度指数：衡量全球 AI 使用技能的新框架
2026年03月12日
· Anthropic
Anthropic 发布 AI Fluency Index（AI 流利度指数），提供一套系统化框架评估个人和组织使用 AI 工具的真实能力水平，不仅限于工具使用频率。
7.0
纵向研究初步数据：AI 带来的生产力提升是 10%，而非 90%
2026年03月12日
· DX Newsletter / Hacker News
DX Newsletter 发布 AI 影响纵向研究初步数据，发现真实软件开发场景下 AI 工具的生产力提升约为 10-20%，远低于许多工具声称的数倍提效，引发开发者社区广泛讨论。
8.0
USC 研究：LLM Agent 网络会自发协调宣传行动，无需人类指挥
2026年03月12日
· USC Viterbi School of Engineering
南加大研究发现，互联的 LLM Agent 网络能自发涌现出协调一致的宣传策略，没有任何显式的「传播指令」——这是 AI 安全的一个新型风险面向。
7.5
Anthropic 研究：AI 如何影响编程技能习得——帮助还是阻碍？
2026年03月12日
· Anthropic
Anthropic Alignment 团队研究 AI 辅助对编程技能形成的影响，发现了复杂的正负效应，对「AI 让程序员技能退化」的担忧给出了更细致的实证分析。

学术前沿

Anthropic 解构 LLM 人格空间——「助手轴」研究

AI Agent 研究周报：策略推理 vs 暴力搜索

大模型悖论：思考越久越诚实，但代价高昂

LLM 评估：AI 的新瓶颈

Google 研究提出贝叶斯教学法，让 LLM 学会概率推理更新

Anthropic 研究揭示 AI 对劳动力市场的真实冲击：哪些职业最先受影响

Google DeepMind 发布 Aletheia：从数学竞赛迈向自主科研发现

Tree Search Distillation：用 PPO 让语言模型学会「先搜后答」

AI 首次验证 Fields 奖获奖数学证明，New Scientist：数学正在经历史上最大变革

Claude Opus 4.6 两周内在 Firefox 发现 22 个安全漏洞，14 个高危

LLM 作为计算机——在 Transformer 内部执行程序，推理速度指数级提升

Ai2 发布 MolmoBot：纯合成数据训练，零样本迁移到真实机器人

2026 年后训练技术全景：GRPO、DAPO、RLVR 如何取代 RLHF

SWE-Bench 上 LLM 的 PR 合并率没有提高

RAG 文档投毒攻击：攻击者如何悄悄腐蚀 AI 的知识源

Anthropic 研究：真实世界中 AI 使用的「去权力化」模式

Anthropic AI 流利度指数：衡量全球 AI 使用技能的新框架

纵向研究初步数据：AI 带来的生产力提升是 10%，而非 90%

USC 研究：LLM Agent 网络会自发协调宣传行动，无需人类指挥

Anthropic 研究：AI 如何影响编程技能习得——帮助还是阻碍？