评分 7 · 来源: · 发布于 评分依据:提出轻量方法使预训练VLA可通过数小时真实实践进行在线RL微调,RL Token设计简洁有效,对机器人学习有实用价值。
评分 7 · 来源: · 发布于
评分依据:提出轻量方法使预训练VLA可通过数小时真实实践进行在线RL微调,RL Token设计简洁有效,对机器人学习有实用价值。