Anthropic 展示 Long-running Claude：让 LLM 突破上下文窗口执行长时间科学计算

评分 7.4 · 来源：Anthropic · 发布于 2026-03-23

评分依据：首次披露 Claude 长时间运行科学计算的完整方案，外部记忆+检查点突破上下文窗口限制的方法论具有直接参考价值

要点

Anthropic 展示了一套让 Claude 执行长时间科学计算的系统化方法。核心思路是通过外部记忆系统和周期性检查点机制，让模型在超出单次上下文窗口限制的任务中保持连贯性。

具体方案包括：将计算状态序列化到外部存储，每次恢复时重建完整上下文；设计任务分解策略，将长时间计算拆分为可独立验证的子任务；以及引入自我验证循环，在每个检查点让 Claude 回顾前序计算结果的一致性。

这标志着 LLM 从「对话式助手」向「持久化计算代理」的重要转变——模型不再受限于单次会话的记忆窗口，而是像传统计算程序一样可中断、可恢复、可验证。

上下文窗口一直是 LLM 做复杂任务的硬天花板。Anthropic 这套方案没有选择「把窗口无限拉长」的路径，而是走了「外部化记忆 + 结构化检查点」的工程路线，这其实是更务实的解法。对正在构建 Agent 系统的开发者来说，检查点恢复和状态序列化的设计模式值得直接借鉴。