评分 6 · 来源:arXiv · 发布于 2026-04-09 评分依据:推理模型早退出策略:利用Think后的熵信号,实用的推理效率优化
评分 6 · 来源:arXiv · 发布于 2026-04-09
评分依据:推理模型早退出策略:利用Think后的熵信号,实用的推理效率优化