Skip to content
星际流动

SafeConstellations: Mitigating Over-Refusals in LLMs Through Task-Aware Representation Steering

发布
采集
学术前沿 6.0 分 — 通过表示转向缓解LLM过度拒绝问题,实证表明过度拒绝在生产环境中普遍存在且影响可用性。时效性强。
原文: cs.CL updates on arXiv.org

评分 6 · 来源:cs.CL updates on arXiv.org · 发布于 2026-04-14

评分依据:通过表示转向缓解LLM过度拒绝问题,实证表明过度拒绝在生产环境中普遍存在且影响可用性。时效性强。