评分 7 · 来源:cs.CL updates on arXiv.org · 发布于 2026-04-22
评分依据:15个LLM × 8个优化任务的大规模轨迹分析,揭示zero-shot能力与优化表现的相关性机制。系统性研究,insight丰富
研究范围
- 15个LLM:覆盖5个实验室,从小型到前沿规模
- 8个优化任务:多样化的问题类型
- 轨迹分析:深入理解优化过程 dynamics
核心发现
- Zero-shot问题解决能力与最终优化产出正相关,但非唯一因素
- 不同LLM展现出截然不同的优化”风格”
- 探索-利用权衡在各模型间差异显著
实际意义
为选择适合优化任务的LLM提供实证依据,对LLM-as-optimizer方向(如代码优化、prompt优化、超参搜索)有直接参考价值。