评分 5 · 来源:arXiv cs.LG · 发布于 2026-04-29
评分依据:ECO 框架结合 Mamba 和批量化 PO 提升 NCO 效率
ECO 将神经组合优化效率作为一等目标。通过两阶段解耦:预计算解的监督 warm-up + 迭代 DPO,配合 Mamba backbone,实现高效学习。
评分 5 · 来源:arXiv cs.LG · 发布于 2026-04-29
评分依据:ECO 框架结合 Mamba 和批量化 PO 提升 NCO 效率
ECO 将神经组合优化效率作为一等目标。通过两阶段解耦:预计算解的监督 warm-up + 迭代 DPO,配合 Mamba backbone,实现高效学习。