Skip to content
星际流动
模型动态
工程实践
学术前沿
行业动态
深度观点
算力硬件
政策伦理
文章库
模型动态
工程实践
学术前沿
行业动态
深度观点
算力硬件
政策伦理
文章库
首页
/
标签
/
奖励函数
Tag:
奖励函数
All the articles with the tag "奖励函数".
6.7
OS-Themis:可扩展的多 Agent 评判框架,GUI Agent RL 训练提升 10.3%
2026年03月22日
·
arXiv
· 03/22 10:31 采集
将 GUI Agent 轨迹分解为可验证里程碑,通过多 Agent 审查机制构建高质量奖励函数