Skip to content
星际流动

Large Language Models Explore by Latent Distilling (ESamp)

发布
采集
学术前沿 5.5 分 — ESamp 解码方法鼓励语义多样性探索,对 test-time scaling 有意义
原文: arXiv cs.LG

评分 5.5 · 来源:arXiv cs.LG · 发布于 2026-04-29

评分依据:ESamp 解码方法鼓励语义多样性探索,对 test-time scaling 有意义

生成多样响应对 LLM test-time scaling 至关重要,但标准随机采样主要产生表层词汇变化。ESamp 显式鼓励语义多样性,动机来自神经网络倾向于做出低误差预测的观察。


标签: