Skip to content
星际流动

CUA-Suite:大规模人工标注视频演示数据集,推动 Computer-Use Agent

发布
采集
工程实践 7.4 分 — 填补 CUA 训练数据空白,此前最大开放数据集仅 20 小时视频
原文: cs.LG updates on arXiv.org

评分 7.4 · 来源:cs.LG updates on arXiv.org · 发布于 2026-03-26

评分依据:填补 CUA 训练数据空白,此前最大开放数据集仅 20 小时视频

要点

此前 ScaleCUA 仅 200 万截图约 20 小时视频,远不够训练通用 CUA。CUA-Suite 是大规模人工标注视频演示数据集,强调连续视频而非稀疏截图是扩展关键。

🤖 AI 点评

CUA 核心瓶颈在训练数据而非模型架构。CUA-Suite 可能催生 CUA 能力跃升,类似 ImageNet 之于 CV。


标签: