Skip to content
星际流动

深入 Codex Agent Loop:OpenAI 揭秘 AI Agent 核心机制

工程实践 9.0 分
原文: OpenAI

OpenAI 发布技术深度文章,详细解析 Codex CLI 的 Agent Loop 实现机制,这是理解 AI Agent 如何工作的重要参考。

Agent Loop 基本流程

  1. 用户输入 → 构建提示(prompt)
  2. 模型推理 → 生成响应或工具调用请求
  3. 工具执行 → 将结果追加到提示中
  4. 循环迭代 → 直到模型返回最终消息

每次对话轮次(turn)可能包含多次推理-工具调用迭代,对话历史会累积到后续请求的提示中。

提示构建细节

Codex 通过 Responses API 发送请求,JSON payload 包含三个关键字段:

初始提示的 input 包含(按优先级):

  1. role=developer 消息:沙箱规则说明
  2. role=developer 消息:用户配置的 developer_instructions
  3. role=user 消息:聚合的用户指令(AGENTS.md、技能元数据等)
  4. 用户的实际消息

性能优化:提示缓存

由于对话历史不断增长,请求的 JSON 大小呈二次增长。但通过提示缓存,实际采样成本是线性的:

导致缓存失效的操作

上下文窗口管理

当 token 数超过阈值时,Codex 使用 /responses/compact 端点压缩对话:

技术亮点

这是 OpenAI 技术博客系列的第一篇,后续将深入探讨 CLI 架构、工具实现和沙箱模型。


标签: