Skip to content
星际流动
模型动态
工程实践
学术前沿
行业动态
深度观点
算力硬件
政策伦理
文章库
模型动态
工程实践
学术前沿
行业动态
深度观点
算力硬件
政策伦理
文章库
首页
/
标签
/
测试质量
Tag:
测试质量
All the articles with the tag "测试质量".
7.0
ACES:谁来测试测试本身?代码生成的 Leave-One-Out AUC 一致性方法
2026年04月07日
·
cs.LG updates on arXiv.org
· 04/08 12:31 采集
提出用测试的排序能力而非通过率来评估 LLM 生成测试的质量,解决测试本身可能错误的循环依赖问题