评分 7 · 来源:cs.LG updates on arXiv.org · 发布于 2026-04-22
评分依据:用多核布尔参数表示LLM的新型二值化框架,无需全精度潜权重。推理效率突破性工作
权重二值化的困境
现有方法分为两类:
- 后训练二值化:简单但性能损失严重
- 训练感知方法:依赖全精度潜权重,增加复杂度和限制效率
Multi-Boolean 方案
- 用多核布尔参数表示LLM
- 无需全精度潜权重
- 训练和推理均使用布尔运算
- 兼顾效率和效果
意义
为端侧LLM部署提供了新的技术路径,对资源受限场景(移动端、嵌入式)具有重要价值。