评分 7.5 · 来源:cs.LG updates on arXiv.org · 发布于 2026-04-16 评分依据:零开销探针监控LLM agent推理退化,检测率高达30%任务失败的前兆,轻量级并行监控架构极具工程价值