学术前沿
「学术前沿」分类下的所有文章
- 8.8
Anthropic 解构 LLM 人格空间——「助手轴」研究
Anthropic 新研究从神经激活角度定义「助手轴」,揭示 LLM 人格漂移的内在机制,并提出激活限幅方案稳定模型行为。
- 7.8
- 7.5
- 7.5
- 8.0
Google 研究提出贝叶斯教学法,让 LLM 学会概率推理更新
· InfoQGoogle 研究人员提出一种新训练方法,通过让大模型模拟最优贝叶斯系统的预测,使其具备随新证据动态更新信念的能力,解决了 LLM 推理僵化的核心问题。
- 8.5
Anthropic 研究揭示 AI 对劳动力市场的真实冲击:哪些职业最先受影响
· EuronewsAnthropic 发布基于真实 Claude 使用数据的劳动力市场研究,引入「观测暴露度」新指标,发现 AI 正优先渗透高薪专业岗位,而高暴露度职业的就业增速明显低于低暴露度职业。
- 8.5
Google DeepMind 发布 Aletheia:从数学竞赛迈向自主科研发现
DeepMind 推出数学研究智能体 Aletheia,能够自主生成、验证和修正数学证明,从竞赛题解决者升级为专业研究员。
- 7.0
Tree Search Distillation:用 PPO 让语言模型学会「先搜后答」
研究者提出树搜索蒸馏方法,通过 PPO 将 MCTS 等树搜索过程内化到 LLM 推理中,推理时无需额外搜索即可受益。
- 8.0
AI 首次验证 Fields 奖获奖数学证明,New Scientist:数学正在经历史上最大变革
AI 系统成功验证了 Maryna Viazovska 的球堆积问题证明(2022 Fields 奖),OpenAI 和 Google DeepMind 的 AI 模型也在尝试解决 First Proof 难题。
- 9.0
Claude Opus 4.6 两周内在 Firefox 发现 22 个安全漏洞,14 个高危
Mozilla 与 Anthropic Frontier Red Team 合作,用 Claude Opus 4.6 对 Firefox JavaScript 引擎进行安全审计,发现 22 个漏洞其中 14 个高危,AI 还为已修复漏洞生成了可工作的 exploit,全部已在 Firefox 148 中修复。
- 8.5
LLM 作为计算机——在 Transformer 内部执行程序,推理速度指数级提升
Percepta AI 提出全新架构:将程序直接编码进 Transformer 权重中执行,无需传统计算硬件,推理速度可达指数级加速。Hacker News 排名第一。
- 8.5
Ai2 发布 MolmoBot:纯合成数据训练,零样本迁移到真实机器人
Allen Institute for AI 开源 MolmoBot,首次实现无需真实数据的零样本 sim-to-real 迁移,模型已在真实机械臂上验证。
- 8.0
2026 年后训练技术全景:GRPO、DAPO、RLVR 如何取代 RLHF
深度综述 GRPO、DAPO、RLVR 等后训练方法如何成为主流,以及合成自博弈数据为何让 RLHF 退出历史舞台。
- 7.5
SWE-Bench 上 LLM 的 PR 合并率没有提高
研究发现尽管 SWE-Bench 基准分数持续上升,LLM 生成的 PR 实际被合并进主分支的比例并未改善,暗示评测与现实脱节。
- 7.0
- 7.5
Anthropic 研究:真实世界中 AI 使用的「去权力化」模式
Anthropic 发布新研究,分析现实场景中 AI 助手如何可能在无意间强化用户的心理依赖与自主能力丧失,并探讨如何设计更赋权的 AI 交互。
- 7.0
Anthropic AI 流利度指数:衡量全球 AI 使用技能的新框架
Anthropic 发布 AI Fluency Index(AI 流利度指数),提供一套系统化框架评估个人和组织使用 AI 工具的真实能力水平,不仅限于工具使用频率。
- 7.0
纵向研究初步数据:AI 带来的生产力提升是 10%,而非 90%
DX Newsletter 发布 AI 影响纵向研究初步数据,发现真实软件开发场景下 AI 工具的生产力提升约为 10-20%,远低于许多工具声称的数倍提效,引发开发者社区广泛讨论。
- 8.0
USC 研究:LLM Agent 网络会自发协调宣传行动,无需人类指挥
南加大研究发现,互联的 LLM Agent 网络能自发涌现出协调一致的宣传策略,没有任何显式的「传播指令」——这是 AI 安全的一个新型风险面向。
- 7.5
Anthropic 研究:AI 如何影响编程技能习得——帮助还是阻碍?
Anthropic Alignment 团队研究 AI 辅助对编程技能形成的影响,发现了复杂的正负效应,对「AI 让程序员技能退化」的担忧给出了更细致的实证分析。