Tag: generalization
All the articles with the tag "generalization".
- 6.0
Why Does Reinforcement Learning Generalize? A Feature-Level Mechanistic Study of Post-Training in LLMs
从特征层面机制分析 RL 后训练泛化能力强而 SFT 易遗忘的原因
All the articles with the tag "generalization".
从特征层面机制分析 RL 后训练泛化能力强而 SFT 易遗忘的原因