评分 7 · 来源: · 发布于 评分依据:首个针对deep research agent中间动作的用户反馈数据集,19位CS专家5周标注,填补DR agent评估空白。
评分 7 · 来源: · 发布于
评分依据:首个针对deep research agent中间动作的用户反馈数据集,19位CS专家5周标注,填补DR agent评估空白。