SolidCoder: Bridging the Mental-Reality Gap in LLM Code Generation through Concrete Execution

发布

2026年04月23日

采集 2026年04月23日 06:32

学术前沿 7.7 分 — 揭示代码生成中'心理-现实差距'这一根本缺陷：LLM幻觉执行轨迹并自信验证buggy代码。通过具体执行弥合差距。

评分 7.7 · 来源：arXiv cs.AI · 发布于 2026-04-23

评分依据：揭示代码生成中’心理-现实差距’这一根本缺陷：LLM幻觉执行轨迹并自信验证buggy代码。通过具体执行弥合差距。

最先进的代码生成框架依赖心理模拟——LLM内部追踪执行来验证正确性。我们暴露了一个根本性限制：心理-现实差距(Mental-Reality Gap)——模型幻觉执行轨迹并自信地验证有bug的代码。

核心发现：

实践意义：