Unsupervised Confidence Calibration for Reasoning LLMs from a Single Generation

发布

2026年04月22日

采集 2026年04月22日 06:31

学术前沿 8.0 分 — 仅需单次生成即可实现推理LLM的无监督置信度校准，无需标签或重复采样。实用性极强的校准方法

评分 8 · 来源：cs.LG updates on arXiv.org · 发布于 2026-04-22

评分依据：仅需单次生成即可实现推理LLM的无监督置信度校准，无需标签或重复采样。实用性极强的校准方法

校准困境

推理模型能解决越来越复杂的任务，但难以产生校准良好的置信度估计。现有方法通常依赖：

单次生成即可校准：

使置信度校准在实际部署中变得可行：

这是校准方法走向落地的关键一步。