Tag: 编程Agent
All the articles with the tag "编程Agent".
- 7.0
ACES:谁来测试测试本身?代码生成的 Leave-One-Out AUC 一致性方法
提出用测试的排序能力而非通过率来评估 LLM 生成测试的质量,解决测试本身可能错误的循环依赖问题
- 7.0
Moonshot AI 确认 Kimi-k2.5 为 Cursor Composer 2 底座模型
Kimi 官方确认其旗舰模型通过 FireworksAI 平台为 Cursor 最新编程 Agent 提供基础能力