Skip to content
星际流动

SolidCoder: Bridging the Mental-Reality Gap in LLM Code Generation through Concrete Execution

发布
采集
学术前沿 7.7 分 — 揭示代码生成中'心理-现实差距'这一根本缺陷:LLM幻觉执行轨迹并自信验证buggy代码。通过具体执行弥合差距。
原文: arXiv cs.AI

评分 7.7 · 来源:arXiv cs.AI · 发布于 2026-04-23

评分依据:揭示代码生成中’心理-现实差距’这一根本缺陷:LLM幻觉执行轨迹并自信验证buggy代码。通过具体执行弥合差距。

最先进的代码生成框架依赖心理模拟——LLM内部追踪执行来验证正确性。我们暴露了一个根本性限制:心理-现实差距(Mental-Reality Gap)——模型幻觉执行轨迹并自信地验证有bug的代码。

核心发现:

实践意义:


标签: