GitHub Copilot CLI推出「Rubber Duck」：用第二个模型给Agent计划做代码审查

评分 7.6 · 来源：The GitHub Blog · 发布于 2026-04-06

评分依据：GitHub官方博客首发，多模型交叉审查是Agent工程的重要新范式，直接可用

要点

GitHub在Copilot CLI中引入了实验性的「Rubber Duck」模式。核心思路：当Agent提出执行计划时，调用来自不同AI家族的第二个模型作为独立审查者，在关键时刻评估计划和执行结果。

为什么用不同的模型家族？因为不同模型犯不同类型的错误——同一个模型的自我审查容易陷入盲区。GitHub的实验显示，这种交叉审查能捕捉到单模型遗漏的结构性问题和安全风险。

该功能目前在Copilot CLI的experimental模式中可用，用户可以选择开启。

「用第二个模型审查第一个模型」这个思路简洁但有效。随着Agent系统越来越复杂，单模型自我纠错的瓶颈会越来越明显。GitHub作为最大的代码平台推出这个功能，可能预示着多模型协作将成为Agent工程的标准实践。