Tag: web-browsing
All the articles with the tag "web-browsing".
- 5.5
DRBENCHER: Can Your Agent Identify the Entity, Retrieve Its Properties and Do the Math?
DRBENCHER 是一个合成 benchmark 生成器,专门生成需要同时进行网页浏览和多步计算的深度研究问题,用于评估 deep research agent 在真实研究场景中的表现。