评分 5 · 来源:arXiv cs.CL · 发布于 2026-04-29
评分依据:用 SAE 分析 LLM 内部情绪推理机制,发现三阶段信息流
LLM 越来越多用于情感敏感的人机交互应用,但内部情绪表征机制未知。本文用 SAE 分析跨层稀疏特征激活,识别出一致的三阶段信息流:情绪相关特征仅在后期层出现。
评分 5 · 来源:arXiv cs.CL · 发布于 2026-04-29
评分依据:用 SAE 分析 LLM 内部情绪推理机制,发现三阶段信息流
LLM 越来越多用于情感敏感的人机交互应用,但内部情绪表征机制未知。本文用 SAE 分析跨层稀疏特征激活,识别出一致的三阶段信息流:情绪相关特征仅在后期层出现。