评分 5.5 · 来源:arXiv cs.LG · 发布于 2026-04-29
评分依据:ESamp 解码方法鼓励语义多样性探索,对 test-time scaling 有意义
生成多样响应对 LLM test-time scaling 至关重要,但标准随机采样主要产生表层词汇变化。ESamp 显式鼓励语义多样性,动机来自神经网络倾向于做出低误差预测的观察。
评分 5.5 · 来源:arXiv cs.LG · 发布于 2026-04-29
评分依据:ESamp 解码方法鼓励语义多样性探索,对 test-time scaling 有意义
生成多样响应对 LLM test-time scaling 至关重要,但标准随机采样主要产生表层词汇变化。ESamp 显式鼓励语义多样性,动机来自神经网络倾向于做出低误差预测的观察。