Skip to content
星际流动
模型动态
工程实践
学术前沿
行业动态
深度观点
算力硬件
政策伦理
文章库
模型动态
工程实践
学术前沿
行业动态
深度观点
算力硬件
政策伦理
文章库
首页
/
标签
/
agent评估
Tag:
Agent评估
All the articles with the tag "Agent评估".
7.0
ClawsBench:模拟工作空间中的 LLM 生产力 Agent 能力与安全评估
2026年04月08日
·
cs.AI updates on arXiv.org
· 04/08 14:34 采集
构建模拟工作空间环境全面评估 LLM 生产力 Agent 的能力和安全性,覆盖文件操作、邮件处理等多场景