Tag: 数学推理
All the articles with the tag "数学推理".
- 7.4
DeepMind Aletheia:从数学竞赛到完全自主研究的 AI 智能体
Google DeepMind 发布 Aletheia,基于 Gemini Deep Think 的数学研究智能体,在 IMO-Proof Bench Advanced 上达到 95.1% 准确率,已自主生成发表级研究论文。
- 7.0
HorizonMath:用未解数学问题衡量 AI 的数学发现能力
100+ 未解数学问题基准,GPT 5.4 Pro 在两个问题上提出了超越已知最优解的方案