Coding with Eyes: Visual Feedback Unlocks Reliable GUI Code Generating and Debugging

发布

2026年04月23日

采集 2026年04月23日 06:32

学术前沿 7.0 分 — 视觉反馈解锁GUI代码生成与调试能力，解决了编码Agent在GUI场景下依赖文本反馈的痛点，实用性突出。

评分 7 · 来源：arXiv cs.AI · 发布于 2026-04-23

评分依据：视觉反馈解锁GUI代码生成与调试能力，解决了编码Agent在GUI场景下依赖文本反馈的痛点，实用性突出。

当前基于LLM的Agent在代码生成上进展显著，但主要依赖基于文本输出的反馈（如命令行输出）进行多轮调试，在涉及视觉信息的图形用户界面(GUI)中表现挣扎。

核心突破：