Tag: 不确定性

All the articles with the tag "不确定性".

7.0
Reaching Beyond the Mode：强化学习实现语言模型分布推理
2026年03月27日
· cs.CL updates on arXiv.org· 03/27 12:31 采集
用 RL 训练语言模型输出多答案分布而非单一最优答案，解决当前模型在医疗诊断等不确定性场景的局限性。
7.4
为什么自蒸馏有时会损害 LLM 的推理能力
2026年03月26日
· cs.LG updates on arXiv.org· 03/26 14:33 采集
揭示自蒸馏导致推理退化根因——认知不确定性表达的系统性抑制