Skip to content
星际流动
模型动态
工程实践
学术前沿
行业动态
深度观点
算力硬件
政策伦理
文章库
模型动态
工程实践
学术前沿
行业动态
深度观点
算力硬件
政策伦理
文章库
首页
/
标签
/
对齐移除
Tag:
对齐移除
All the articles with the tag "对齐移除".
7.7
理解安全对齐移除:越狱微调和权重正交化如何瓦解 LLM 安全护栏
2026年04月06日
·
arXiv cs.AI
· 04/06 12:33 采集
首次系统分析越狱微调和权重正交化两种安全移除方法的影响范围,发现安全退化不仅限于拒绝有害请求,还会影响模型整体的推理质量。