Skip to content
星际流动

Benchmarking LLM Tool-Use in the Wild

发布
采集
学术前沿 7.0 分 — 真实世界LLM工具使用基准——填补了benchmark与现实gap的重要工作
原文: arXiv

评分 7 · 来源:arXiv · 发布于 2026-04-09

评分依据:真实世界LLM工具使用基准——填补了benchmark与现实gap的重要工作