LLM 自我改进技术综述：方法全景与未来展望

发布

2026年03月27日

采集 2026年03月27日 04:31

深度观点 6.5 分 — 系统性综述自我改进这一重要方向的现状与未来，但属于综述性质缺少新颖实证

评分 6.5 · 来源：cs.CL updates on arXiv.org · 发布于 2026-03-27

评分依据：系统性综述自我改进这一重要方向的现状与未来，但属于综述性质缺少新颖实证

要点

随着 LLM 能力接近人类水平，单纯依赖人类监督的改进方式在成本和效果上都遇到瓶颈。论文系统综述了自我训练、自我评估、自我优化等自我改进技术方向，探讨了模型自主决策和复杂行动能力如何赋能自我改进。

自我改进是 LLM 突破「人类天花板」的关键路径。但当模型越来越擅长自我优化时，如何确保优化方向与人类意图一致？这是一个技术问题，更是一个对齐问题。