Tag: AI能力

All the articles with the tag "AI能力".

7.0
ARC-AGI-3 血洗全球大模型：人类满分，AI第一名仅 0.2%
2026年03月26日
· 36氪 - 科技频道· 03/26 20:32 采集
ARC-AGI-3 基准测试出炉，从静态题升级为交互式游戏，150多个关卡让所有顶尖大模型全军覆没，Opus 4.6 从 69.2% 暴跌至 0.2%，揭示了当前 AI 能力中最深的裂隙。