Rethinking Efficiency in Neural Combinatorial Optimization: Batched Preference Optimization with Mamba

发布

2026年04月29日

采集 2026年04月29日 06:31

学术前沿 5.0 分 — ECO 框架结合 Mamba 和批量化 PO 提升 NCO 效率

原文： arXiv cs.LG

评分 5 · 来源：arXiv cs.LG · 发布于 2026-04-29

评分依据：ECO 框架结合 Mamba 和批量化 PO 提升 NCO 效率

ECO 将神经组合优化效率作为一等目标。通过两阶段解耦：预计算解的监督 warm-up + 迭代 DPO，配合 Mamba backbone，实现高效学习。

标签：

Relational In-Context Learning via Synthetic Pre-training with Structural Prior

Principled Detection of Hallucinations in LLMs via Multiple Testing