评分 6.5 · 来源: · 发布于 评分依据:实现1-bit量化LLM上的RL训练,推动边缘端部署可能性,对资源受限场景有实际意义。
评分 6.5 · 来源: · 发布于
评分依据:实现1-bit量化LLM上的RL训练,推动边缘端部署可能性,对资源受限场景有实际意义。