评分 7 · 来源:arXiv cs.AI · 发布于 2026-04-23
评分依据:用小语言模型实现轻量级Agent记忆系统,解决检索式记忆精度不稳定问题,对降低Agent部署成本有实际意义。
虽然LLM Agent可以利用工具执行复杂任务,但仍需要记忆来维持跨轮次一致性并在长时程交互中积累可复用信息。然而,基于检索的外部记忆系统在线开销低但由于有限的查询构建和候选过滤而精度不稳定。
方案:SLM驱动的轻量记忆
- 用小语言模型替代大模型做记忆管理
- 降低Agent部署成本的同时提高记忆精度
- 解决检索式记忆的查询构建和候选过滤瓶颈
- 保持低在线开销的同时提升稳定性
实际意义:
- 使长时程Agent更经济可行
- 对资源受限部署场景尤其有价值