Skip to content
星际流动

GitHub Copilot CLI推出「Rubber Duck」:用第二个模型给Agent计划做代码审查

发布
采集
工程实践 7.6 分 — GitHub官方博客首发,多模型交叉审查是Agent工程的重要新范式,直接可用
原文: The GitHub Blog

评分 7.6 · 来源:The GitHub Blog · 发布于 2026-04-06

评分依据:GitHub官方博客首发,多模型交叉审查是Agent工程的重要新范式,直接可用

要点

GitHub在Copilot CLI中引入了实验性的「Rubber Duck」模式。核心思路:当Agent提出执行计划时,调用来自不同AI家族的第二个模型作为独立审查者,在关键时刻评估计划和执行结果。

为什么用不同的模型家族?因为不同模型犯不同类型的错误——同一个模型的自我审查容易陷入盲区。GitHub的实验显示,这种交叉审查能捕捉到单模型遗漏的结构性问题和安全风险。

该功能目前在Copilot CLI的experimental模式中可用,用户可以选择开启。

🤖 AI 点评

「用第二个模型审查第一个模型」这个思路简洁但有效。随着Agent系统越来越复杂,单模型自我纠错的瓶颈会越来越明显。GitHub作为最大的代码平台推出这个功能,可能预示着多模型协作将成为Agent工程的标准实践。


标签: