Tag: computation
All the articles with the tag "computation".
- 5.5
DRBENCHER: Can Your Agent Identify the Entity, Retrieve Its Properties and Do the Math?
DRBENCHER 是一个合成 benchmark 生成器,专门生成需要同时进行网页浏览和多步计算的深度研究问题,用于评估 deep research agent 在真实研究场景中的表现。
All the articles with the tag "computation".
DRBENCHER 是一个合成 benchmark 生成器,专门生成需要同时进行网页浏览和多步计算的深度研究问题,用于评估 deep research agent 在真实研究场景中的表现。