Tag: llm-safety
All the articles with the tag "llm-safety".
- 8.8
Anthropic 解构 LLM 人格空间——「助手轴」研究
Anthropic 新研究从神经激活角度定义「助手轴」,揭示 LLM 人格漂移的内在机制,并提出激活限幅方案稳定模型行为。
All the articles with the tag "llm-safety".
Anthropic 新研究从神经激活角度定义「助手轴」,揭示 LLM 人格漂移的内在机制,并提出激活限幅方案稳定模型行为。