Tag: 基准测试
All the articles with the tag "基准测试".
- 7.2
SPEED-Bench:NVIDIA 发布统一推测解码评估基准
NVIDIA 联合 HuggingFace 推出 SPEED-Bench,为推测解码提供覆盖多语义领域、高并发场景的标准化评估框架。
- 6.7
- 7.0
HorizonMath:用未解数学问题衡量 AI 的数学发现能力
100+ 未解数学问题基准,GPT 5.4 Pro 在两个问题上提出了超越已知最优解的方案
All the articles with the tag "基准测试".
NVIDIA 联合 HuggingFace 推出 SPEED-Bench,为推测解码提供覆盖多语义领域、高并发场景的标准化评估框架。
100+ 未解数学问题基准,GPT 5.4 Pro 在两个问题上提出了超越已知最优解的方案