Tag: Agent 效率
All the articles with the tag "Agent 效率".
- 7.7
ROM:首个流式推理「过度思考」实时检测与缓解方法,93.5% 准确率
提出将 LLM 过度思考缓解建模为流式预测与控制问题,轻量检测头实时监控 token,实现 47.2% 响应长度压缩。
All the articles with the tag "Agent 效率".
提出将 LLM 过度思考缓解建模为流式预测与控制问题,轻量检测头实时监控 token,实现 47.2% 响应长度压缩。