Skip to content
星际流动

DRACULA: Hunting for the Actions Users Want Deep Research Agents to Execute

发布
采集
行业动态 7.0 分 — 首个针对deep research agent中间动作的用户反馈数据集,19位CS专家5周标注,填补DR agent评估空白。
原文: arxiv.org

评分 7 · 来源: · 发布于

评分依据:首个针对deep research agent中间动作的用户反馈数据集,19位CS专家5周标注,填补DR agent评估空白。