Skip to content
星际流动

Weight Patching: Toward Source-Level Mechanistic Localization in LLMs

发布
采集
学术前沿 5.5 分 — 机制可解释性新方法——权重修补实现源级行为定位,超越激活空间定位的局限,理论贡献扎实但偏学术
原文: arxiv.org

评分 5.5 · 来源: · 发布于 2026-04-17

评分依据:机制可解释性新方法——权重修补实现源级行为定位,超越激活空间定位的局限,理论贡献扎实但偏学术