Skip to content
星际流动

WASD: Locating Critical Neurons as Sufficient Conditions for Explaining and Controlling LLM Behavior

发布
采集
学术前沿 7.5 分 — 神经元级行为控制突破:通过充分条件定位关键神经元实现自然语言可控性,兼具可解释性和控制能力。
原文: arxiv.org

评分 7.5 · 来源: · 发布于 2026-04-10

评分依据:神经元级行为控制突破:通过充分条件定位关键神经元实现自然语言可控性,兼具可解释性和控制能力。