Tag: Steering
All the articles with the tag "Steering".
- 7.0
Where to Steer:输入依赖的层级选择让 LLM 对齐效果更好
研究发现不同输入的最优干预层不同,提出输入依赖的层级选择策略用于 steering vector,显著提升 LLM 对齐效果
- 7.0
用激活方向控制 Code LLM 的语言和库偏好
估计语言/库 steering 向量,推理时控制 Code LLM 输出生态偏好
All the articles with the tag "Steering".
研究发现不同输入的最优干预层不同,提出输入依赖的层级选择策略用于 steering vector,显著提升 LLM 对齐效果
估计语言/库 steering 向量,推理时控制 Code LLM 输出生态偏好