评分依据:以执行 grounded verification 为第一原则的多 Agent 编程框架,Planner/Coder/Tester/Debugger/Critic 协作 + Docker 沙箱强制验证,直击 AI 编码 Agent 核心痛点——代码正确性验证
AgentForge: Execution-Grounded Multi-Agent LLM Framework for Autonomous Software Engineering
发布
采集
学术前沿 7.5 分
— 以执行 grounded verification 为第一原则的多 Agent 编程框架,Planner/Coder/Tester/Debugger/Critic 协作 + Docker 沙箱强制验证,直击 AI 编码 Agent 核心痛点——代码正确性验证 原文: arxiv.org