Skip to content
星际流动
模型动态
工程实践
学术前沿
行业动态
深度观点
算力硬件
政策伦理
文章库
模型动态
工程实践
学术前沿
行业动态
深度观点
算力硬件
政策伦理
文章库
首页
/
标签
/
grpo
Tag:
GRPO
All the articles with the tag "GRPO".
7.0
Prune as You Generate:RLVR 在线剪枝加速训练并提升效果
2026年03月27日
·
cs.CL updates on arXiv.org
· 03/27 12:31 采集
提出在线 rollout 剪枝方法,在强化学习训练过程中动态淘汰低质量采样,同时减少计算成本并提升最终性能。