评分 7.6 · 来源:The GitHub Blog · 发布于 2026-04-06
评分依据:GitHub官方博客首发,多模型交叉审查是Agent工程的重要新范式,直接可用
要点
GitHub在Copilot CLI中引入了实验性的「Rubber Duck」模式。核心思路:当Agent提出执行计划时,调用来自不同AI家族的第二个模型作为独立审查者,在关键时刻评估计划和执行结果。
为什么用不同的模型家族?因为不同模型犯不同类型的错误——同一个模型的自我审查容易陷入盲区。GitHub的实验显示,这种交叉审查能捕捉到单模型遗漏的结构性问题和安全风险。
该功能目前在Copilot CLI的experimental模式中可用,用户可以选择开启。
🤖 AI 点评
「用第二个模型审查第一个模型」这个思路简洁但有效。随着Agent系统越来越复杂,单模型自我纠错的瓶颈会越来越明显。GitHub作为最大的代码平台推出这个功能,可能预示着多模型协作将成为Agent工程的标准实践。