Tag: Muon
All the articles with the tag "Muon".
- 7.7
MUD 优化器:用 Cholesky 白化替代 Muon 极分解,训练速度提升 1.3-2.6x
新优化器 MUD 用 Cholesky-like 三角白化替代 Muon 的极分解更新,在保持 Muon 级收敛质量的同时大幅降低优化器开销
All the articles with the tag "Muon".
新优化器 MUD 用 Cholesky-like 三角白化替代 Muon 的极分解更新,在保持 Muon 级收敛质量的同时大幅降低优化器开销