Tag: coding-agent
All the articles with the tag "coding-agent".
- 6.5
mksglu/context-mode — GitHub Trending
Context window optimization for AI coding agents achieving 98% tool output reduction across 12 platforms via sandboxed output handling.
- 6.6
HiL-Bench (Human-in-Loop Benchmark): Do Agents Know When to Ask for Help?
HiL-Bench 是首个专门评估 AI agent「判断力」的 benchmark——不是给完美指令打分,而是测量 agent 在规格不完整或模糊时是否能识别不确定性并主动寻求人类帮助。
- 7.0
Eight years of wanting, three months of building with AI
Lalit Maganti 花了 8 年构思、3 个月借助 AI 构建 syntaqlite 的 agentic engineering 实践案例
- 8.7
与编码代理一起使用 Git 的最佳实践
Simon Willison 发布详细指南:编码代理如何改变我们使用 Git 的方式,从基础操作到高级历史重写
- 7.3
- 8.0
TDAD:测试驱动的智能体开发,减少 70% 代码回归
结合 AST 代码-测试图构建与加权影响分析,在 SWE-bench 上将解决率从 24% 提升至 32%
- 8.3
Open SWE:LangChain 开源内部编码 Agent 框架
借鉴 Stripe、Ramp、Coinbase 内部 Agent 架构,提供云沙箱、Slack/Linear 集成和子 Agent 编排能力
- 7.5
learn-claude-code:从零搭建 Claude Code 式编程 Agent
开源项目用纯 Bash 实现 Claude Code 核心逻辑,日增 865 星,是学习 AI Coding Agent 架构的最佳实战材料。
- 9.0
Wired深度报道:OpenAI 赛跑追赶 Claude Code
· WiredWired 独家:Claude Code 已占 Anthropic 近五分之一收入,OpenAI 紧急追赶。编程 Agent 已成 AI 竞争最前线。
- 8.5
JetBrains 发布 Junie CLI Beta——LLM 无关的终端编程 Agent
JetBrains 将 Junie 从 IDE 插件升级为独立 CLI,支持在终端、任意 IDE、CI/CD 和 GitHub/GitLab 中使用,与具体 LLM 解耦。
- 7.5
obra/superpowers:78K star 的 Agentic 技能框架与软件开发方法论
GitHub 今日热榜第一的 obra/superpowers 已积累 78K star,是一套专为 AI 代理工作流设计的技能框架和软件开发方法论,今日新增 1483 star。
- 8.7
METR 研究:大量通过 SWE-bench 的 PR 实际上不会被合并
METR 研究发现,许多在 SWE-bench 上获得通过评分的 AI 生成 PR,其质量远达不到实际代码审查标准。
- 5.5
Claude Code 月费 $200,Goose 做同样的事但免费:Coding Agent 的定价困局
· 03/24 22:33 采集VentureBeat 对比 Claude Code 和开源替代方案 Goose 的功能与成本差异