评分 5.5 · 来源: · 发布于 2026-04-17 评分依据:LLM 长期记忆评估新基准,游戏化交互场景设计有创意,填补了动态记忆评估空白,但对普通开发者实用性有限
评分 5.5 · 来源: · 发布于 2026-04-17
评分依据:LLM 长期记忆评估新基准,游戏化交互场景设计有创意,填补了动态记忆评估空白,但对普通开发者实用性有限