Skip to content
星际流动

Unsupervised Confidence Calibration for Reasoning LLMs from a Single Generation

发布
采集
学术前沿 8.0 分 — 仅需单次生成即可实现推理LLM的无监督置信度校准,无需标签或重复采样。实用性极强的校准方法
原文: cs.LG updates on arXiv.org

评分 8 · 来源:cs.LG updates on arXiv.org · 发布于 2026-04-22

评分依据:仅需单次生成即可实现推理LLM的无监督置信度校准,无需标签或重复采样。实用性极强的校准方法

校准困境

推理模型能解决越来越复杂的任务,但难以产生校准良好的置信度估计。现有方法通常依赖:

本文方案

单次生成即可校准

为什么重要

使置信度校准在实际部署中变得可行:

这是校准方法走向落地的关键一步。


标签: