评分 6.5 · 来源:cs.CL updates on arXiv.org · 发布于 2026-04-16 评分依据:前瞻优化赋予LLM多Agent环境中的战略推理能力——预测对手行为和未来行动,填补LLM推理盲区