Skip to content
星际流动

RL Token: Bootstrapping Online RL with Vision-Language-Action Models

发布
采集
行业动态 7.0 分 — 提出轻量方法使预训练VLA可通过数小时真实实践进行在线RL微调,RL Token设计简洁有效,对机器人学习有实用价值。
原文: arxiv.org

评分 7 · 来源: · 发布于

评分依据:提出轻量方法使预训练VLA可通过数小时真实实践进行在线RL微调,RL Token设计简洁有效,对机器人学习有实用价值。