📘 OpenAI Codex理解版 · 从原理到实战
12 · 一句话复盘 Codex 全貌
把所有概念剥到底,Codex 设计就在解决一个问题:
⏱️ 预计阅读 8 分钟 | 🎯 目标:把 11 篇内容压成一条主线,一图把全貌钉死
学完一套工具,最好的检验不是记住多少名词,而是能不能用一句话解释它。这一篇是收官 —— 把 12 篇浓缩成一句话、一张图、一份决策链。
🧭 一句话定义
Codex 是一个 AI Coding Agent —— 它读现场、改文件、调工具、跑验证、交结果。 你的工作不是「让它写代码」,而是「给它目标、上下文、边界、验证,然后审查它的交付」。
🗺️ 一张图看全貌
mindmap
root((🤖 Codex 工程协作系统))
📥 输入侧
目标
上下文(5 层栈)
边界(sandbox + approval)
验证标准
🧠 引擎侧
模型(GPT-5.4 / 5.5)
推理强度(low/medium/high)
上下文窗口(最高 1M)
🛠️ 能力侧
文件 + Shell
浏览器
MCP
Skills / Subagents / Hooks
🚪 入口侧
CLI
IDE 扩展
App
Cloud
📦 输出侧
diff
验证结果
未验证项
剩余风险
👥 团队侧
AGENTS.md
requirements.toml
CI 集成
治理监控
12 篇全部对应到这张图的某个分支。
🪜 12 篇主线串联
flowchart TB
P1["1️⃣ Codex 是什么<br/>—— Coding Agent 不是聊天框"]
P2["2️⃣ 一次任务怎么完成<br/>—— 7 步管线 + 控制系统"]
P3["3️⃣ 上下文从哪来<br/>—— 5 层栈"]
P4["4️⃣ AGENTS.md<br/>—— 项目和 Agent 的接口"]
P5["5️⃣ Sandbox + Approval<br/>—— 墙和门"]
P6["6️⃣ 4 入口怎么选<br/>—— 按身份 1-2 个"]
P7["7️⃣ 工具栈 4 层<br/>—— 文件 + 浏览器 + MCP + Skill"]
P8["8️⃣ Skills / Subagents / Hooks<br/>—— 复用 / 分工 / 检查"]
P9["9️⃣ 模型 / 速度 / 成本<br/>—— 按任务调档"]
P10["🔟 团队落地<br/>—— 共识 + 边界 + 集成 + 自动化 + 治理"]
P11["1️⃣1️⃣ 模糊需求 → 工程任务<br/>—— 分诊 + 证据 + 拆 + 写"]
P12["1️⃣2️⃣ 一句话复盘<br/>—— 你在这里"]
P1 --> P2 --> P3 --> P4 --> P5
P5 --> P6 --> P7 --> P8 --> P9
P9 --> P10 --> P11 --> P12
style P12 fill:#dcfce7,stroke:#22c55e,stroke-width:2px
| 阶段 | 篇次 | 一句话 |
|---|---|---|
| 🌱 认知 | 01 | Codex 不是聊天框,是 Coding Agent |
| 02 | 一次任务是 7 步管线,不是黑盒 | |
| 📥 输入 | 03 | 上下文 5 层栈决定 Codex 看见什么 |
| 04 | AGENTS.md 把规则沉淀到项目 | |
| 🛡️ 边界 | 05 | Sandbox 是墙,Approval 是门 |
| 🚪 入口 | 06 | 4 入口按身份选 1-2 个 |
| 🛠️ 工具 | 07 | 工具栈 4 层,MCP 是 USB |
| 08 | Skills 复用 / Subagent 分工 / Hook 检查 | |
| ⚙️ 调优 | 09 | 按任务复杂度调档,不全开最猛 |
| 👥 团队 | 10 | 5 大支柱:共识/边界/集成/自动化/治理 |
| 🚀 落地 | 11 | 模糊需求 → 工程任务 4 步法 |
| 🪞 复盘 | 12 | 全貌一句话 |
🎯 决策链:接到任何任务,按这条走
flowchart TB
Task[💬 接到任务]
C1{清楚吗}
C2{规则齐吗}
C3{入口选好了吗}
C4{边界画了吗}
C5{需要外部工具吗}
C6{重复任务吗}
A1[🩺 分诊 + 收证据<br/>第 11 篇]
A2[📜 写 / 查 AGENTS.md<br/>第 4 篇]
A3[🚪 4 入口选 1-2<br/>第 6 篇]
A4[🛡️ 配 sandbox + approval<br/>第 5 篇]
A5[🔌 接 MCP / 浏览器<br/>第 7 篇]
A6[🛠️ 做 Skill / Subagent<br/>第 8 篇]
Run[🤖 Codex 执行]
V[✅ 验 4 项证据<br/>diff / 验证 / 未验证 / 风险<br/>第 2 篇]
Task --> C1
C1 -->|否| A1 --> Task
C1 -->|是| C2
C2 -->|否| A2 --> Task
C2 -->|是| C3 --> A3 --> C4 --> A4 --> C5 --> A5 --> C6 --> A6 --> Run --> V
style Run fill:#fef3c7,stroke:#f59e0b
style V fill:#dcfce7,stroke:#22c55e,stroke-width:2px
🎯 这条决策链就是 12 篇的全部用法。把它收藏,每次接任务跑一遍。
📐 第一性原理:为什么 Codex 这样设计
把所有概念剥到底,Codex 设计就在解决一个问题:
如何让一个 AI Agent 在真实工程现场里安全、稳定、可验证地完成任务?
四个关键词:
| 关键词 | 对应概念 |
|---|---|
| 🌐 真实工程现场 | 上下文、AGENTS.md、工具栈、入口 |
| 🔒 安全 | Sandbox、Approval、受保护路径、企业管控 |
| 📐 稳定 | Skills、Subagents、Hooks、模型调档 |
| ✅ 可验证 | 4 项证据交付、CI 集成、治理监控 |
前 11 篇的所有概念,都在解决这 4 个关键词中的某一个。
🏆 一份合格 Codex 用户的自检
读完 12 篇,你应该能回答这些问题(不能就回去重读):
| 维度 | 问题 |
|---|---|
| 🌱 认知 | Codex 和 ChatGPT 最核心的差别是什么? |
| 📥 任务 | 一次稳定的 Codex 任务必备哪 5 项? |
| 📚 上下文 | 5 层上下文栈分别是什么? |
| 📜 规则 | AGENTS.md 该写什么 / 不该写什么? |
| 🛡️ 边界 | sandbox 和 approval 各管什么? |
| 🚪 入口 | 你是哪类用户?该装哪 1-2 个入口? |
| 🛠️ 工具 | MCP 解决什么问题?怎么安全配置? |
| 🔁 复用 | Skill / Subagent / Hook 各管什么? |
| ⚙️ 调优 | 修普通 bug 该开什么档? |
| 👥 团队 | 团队 5 支柱按什么顺序铺? |
| 🚀 实战 | 模糊需求怎么变工程任务? |
💡 翔宇本人的最后一条建议
不要追求"用熟所有功能"。追求"用熟最少必要的功能"。
新手最常见的失败:
- 装 4 个入口 → 哪个都没玩透
- 配 10 个 MCP → 半数不知道在干嘛
- 上来就用 Subagent + Hook + 全套自动化 → 出事不知道哪一环
你需要的不多:
- 1 个入口(IDE 或 Cloud 起步)
- 1 份 AGENTS.md
workspace-write + on-request默认配置- 把任务先分诊后动手这一个习惯
就够 80% 的场景。剩下 20% 等真撞上再加。
🚀 你的下一步
flowchart LR
A["📚 读完 12 篇"]
B["🎯 选 1 个真实小任务"]
C["🤖 用 Codex 跑一次完整决策链"]
D["🔄 复盘哪步卡住了"]
E["📜 把经验沉淀到 AGENTS.md"]
F["🚀 下一个任务更顺"]
A --> B --> C --> D --> E --> F --> B
style F fill:#dcfce7,stroke:#22c55e
💡 学习闭环 = 任务 → 复盘 → 沉淀 → 下一个任务。 Codex 越用越顺,本质是你的 AGENTS.md 在持续进化。
📚 全套 12 篇导航
| # | 章节 | 链接 |
|---|---|---|
| 01 | Codex 到底是什么 | → |
| 02 | 一次任务是怎么完成的 | → |
| 03 | Codex 看到的上下文从哪里来 | → |
| 04 | 为什么 AGENTS.md 能改变 Codex 行为 | → |
| 05 | Codex 为什么需要审批和沙箱 | → |
| 06 | App、IDE、CLI、Cloud 怎么选 | → |
| 07 | 让 Codex 调用工具和访问数据 | → |
| 08 | Skills、Subagents、Hooks 解决什么问题 | → |
| 09 | 控制模型、速度、成本和质量 | → |
| 10 | 团队协作和生产环境怎么落地 | → |
| 11 | 从理解到实战场景 | → |
| 12 | 一句话复盘 Codex 全貌 | (你在这里) |
📝 终章自检
| # | 问题 | 自检 |
|---|---|---|
| 1 | 用一句话说 Codex 是什么? | ☐ |
| 2 | 接到任务的 6 个决策点是什么? | ☐ |
| 3 | 5 个常见认知误区你能立刻指出来吗?(聊天框 / 越多越强 / 默认最猛档 / 4 入口都装 / 测试通过就完成) | ☐ |
✅ 过关标准: "我能用一段话给同事讲清 Codex 是什么、怎么用、怎么避坑。"