Tag: SSM
All the articles with the tag "SSM".
- 7.7
Holotron-12B:高吞吐 Computer Use Agent 开源模型
H Company 联合 NVIDIA 发布 12B 参数 Computer Use 代理模型,SSM 混合架构实现 2 倍吞吐提升
- 7.3
Mamba-3:用状态空间原理推进序列建模的 Pareto 前沿
SSM 架构第三代,引入复数状态更新和 MIMO 机制,在检索、状态追踪和语言建模上全面提升
- 8.1
Mamba-3:SSM 架构第三代迭代,推进性能-效率帕累托前沿
Mamba-3 引入 SSM 启发的三项核心改进(更强表达递归、复值状态更新、MIMO 公式),在 1.5B 规模上以一半状态大小达到 Mamba-2 水平