Tag: 评测基准
All the articles with the tag "评测基准".
- 6.7
Arena 排行榜估值 17 亿美元:被排名公司资助的「不可操纵」基准
前身为 LM Arena 的 Arena 从 UC Berkeley 研究项目迅速成长为 AI 行业权威排行榜,但 OpenAI、Google、Anthropic 同时是其投资者。
- 7.7
DeepMind 提出AGI认知分类学:10 项能力 + 三阶段评估协议
首次将认知科学系统性应用于 AGI 进展测量,联合 Kaggle 发起 20 万美元评测挑战