📚AI 编程官方教程中文版
📘 OpenAI Codex📚 官方教程中文版实战场景

用 Codex 升级 API 接入

当 OpenAI 发布新模型和 API 能力时,升级集成通常不只是把 model name 改掉。API 参数、prompt 写法、tool 假设、respon

当 OpenAI 发布新模型和 API 能力时,升级集成通常不只是把 model name 改掉。API 参数、prompt 写法、tool 假设、response shape 和模型行为都可能变化。正确做法是先盘点现状,再做最小迁移,并用 evals 验证业务行为没有退化。

官方页面:https://developers.openai.com/codex/use-cases/api-integration-migrations

适合什么任务

场景Codex 应该做什么
从旧模型或旧 API surface 升级先查当前官方模型和迁移建议,再修改代码
仓库里 prompt、endpoint、tool calling 混在一起先 inventory 当前模型、端点和工具假设,再制定迁移计划
业务行为不能随升级漂移保留原有行为,只有新 API 或新模型要求时才改
缺少回归检查建 evals pipeline,每次改集成都能跑验证

使用的能力

能力用法链接
$openai-docs在 Codex 修改实现前,拉取当前 model、migration 和 API guidancehttps://github.com/openai/skills/tree/main/skills/.curated/openai-docs

相关官方说明:

起始提示词

请使用 $openai-docs,把这个 OpenAI integration 升级到当前推荐的模型和 API 能力。

请特别查找该模型对应的最新 model guidance 和 prompt guidance。

要求:
- 先盘点仓库里当前使用的 models、endpoints 和 tool assumptions。
- 找到最小迁移方案,让集成迁到当前受支持路径。
- 除非新 API 或新模型明确要求,否则保持现有行为不变。
- 按最新 prompt guidance 更新 prompts。
- 标出需要人工 review 的 prompt、tool 或 response shape 变化。

这个 prompt 的核心是先让 Codex 查当前官方文档,再看仓库现状。不要直接说“把模型换成最新版”,那样容易漏掉 prompt、参数和 response shape 的变化。

为什么不能只改 model name

模型升级经常牵动三类变化:

  1. API 变化:例如文档示例提到 GPT-5.4 时,assistant message 新增了重要的 phase 参数,集成里需要正确处理。
  2. 行为变化:新模型的输出偏好、推理方式、tool 使用方式可能和旧模型不同。
  3. prompt 变化:旧 prompt 在新模型上可能还能跑,但不一定仍是推荐写法。

因此迁移时至少要同时看代码、prompt、tool assumptions 和评估结果。

使用 OpenAI Docs skill

Codex 当前会自动带有 OpenAI Docs skill。做 OpenAI API 集成升级时,prompt 里明确提到 $openai-docs,让 Codex 基于最新文档和迁移建议工作。

官方文档里与升级直接相关的入口包括:

  • latest model guide:看当前推荐模型和模型特性。
  • prompt guidance:看对应模型的 prompt 写法。
  • OpenAI Docs MCP:让本地或团队工作流稳定拿到官方文档。
  • Evals guide:构建回归验证。

OpenAI Docs skill 也包含迁移参考,例如官方样例里的 upgrading-to-gpt-5p4.md

https://github.com/openai/codex/blob/6323f0104d17d211029faab149231ba787f7da37/codex-rs/skills/src/assets/samples/openai-docs/references/upgrading-to-gpt-5p4.md

推荐迁移顺序

  1. 盘点仓库里所有 OpenAI 调用点。
  2. 记录当前使用的 models、endpoints、tools、response parsing 和 prompt 文件。
  3. $openai-docs 查当前模型和 prompt guidance。
  4. 写最小迁移计划,只覆盖必须改的路径。
  5. 修改 API 参数和模型调用。
  6. 更新 prompt,但保留业务目标和输出契约。
  7. 标出需要人工 review 的 prompt、tool 或 response-shape 变化。
  8. 运行现有测试和 evals。
  9. 对失败样例做差异分析,再决定是否继续改 prompt 或代码。

建 evals pipeline

Codex 可以根据最新 prompt guidance 自动更新 prompt,但你仍然需要自动化验证。每次改集成,都应该跑一次 evals,确认关键 workflow 没有行为退化。

一个实用的 evals pipeline 至少覆盖:

  • 代表性输入。
  • 期望输出或评分标准。
  • tool calling 是否仍按预期发生。
  • response shape 是否兼容下游解析。
  • 关键业务场景是否保持原有质量。

没有 evals 的模型升级,很容易变成“代码能跑,但业务行为变了”。

On this page