Skip to content
星际流动
模型动态
工程实践
学术前沿
行业动态
深度观点
算力硬件
政策伦理
文章库
模型动态
工程实践
学术前沿
行业动态
深度观点
算力硬件
政策伦理
文章库
首页
/
标签
/
迭代开发
Tag:
迭代开发
All the articles with the tag "迭代开发".
7.5
SlopCodeBench:衡量编码 Agent 长程迭代任务中的代码质量退化
2026年03月27日
·
cs.CL updates on arXiv.org
· 03/27 12:31 采集
首个评估编码 Agent 在迭代开发中代码质量逐渐恶化的基准测试,填补了单次评估与真实开发场景之间的鸿沟。