理解网络安全边界

📖 本篇术语速查表

英文 / 缩写	中文	一句话解释
网络边界	network boundary	限定 Codex 能访问哪些外部地址。
Trusted access	受信访问	经核验的安全网络访问机制。
False positive	误报	安全机制错拦了正常访问。

不想读完？把下面这段提示词丢给 AI 帮你跑完——帮你配好网络安全边界，并处理误报。

你是 Codex 网络安全边界顾问，帮我按最小化原则配好网络访问并处理误报。

【角色】
你理解网络安全机制为什么这么做、它怎么工作、trusted access 的作用、误报怎么处理。

【输入】
- 任务为什么要联网：___
- 涉及的外部地址 / 服务：___
- 是否处理敏感数据：___
- 遇到过的拦截 / 误报：___

【工作流程】
1. 判断联网是否必需、能否替代
2. 按最小化配网络边界（限域名）
3. 说明 trusted access 怎么用
4. 给误报的判断和处理

【输出规范】
▌一、是否必需联网 + 替代方案
▌二、最小化网络边界配置
▌三、trusted access 使用
▌四、误报判断与处理

【硬约束】
- 网络默认关，按需开、限域名、用完收回
- 写请求比读请求更严格
- 敏感数据防外泄
- 误报不靠关掉安全机制来"解决"
- 不确定的机制标注需查官方文档

GPT-5.3-Codex 是 OpenAI 按 Preparedness Framework 作为 High cybersecurity capability 对待的第一个模型，因此需要额外 safeguards。

这些 safeguards 包括训练模型拒绝明显 malicious requests，例如窃取 credentials。

除了 safety training，OpenAI 还使用 automated classifier-based monitors 检测 suspicious cyber activity signals，并把 high-risk traffic 路由到 cyber capability 较低的模型，也就是 GPT-5.2。

OpenAI 预期只有很小一部分 traffic 会受到这些 mitigations 影响，并且正在持续完善 policies、classifiers 和 in-product notifications。

Why we’re doing this

过去几个月，模型在 cybersecurity tasks 上的能力有明显提升，这对 developers 和 security professionals 都有价值。

随着模型越来越擅长 vulnerability discovery 这类 cybersecurity-related tasks，OpenAI 采取 precautionary approach：扩大 protections 和 enforcement，在支持 legitimate research 的同时减缓 misuse。

Cyber capabilities 天然是 dual-use。支撑重要 defensive work 的同一套知识和技术，例如 penetration testing、vulnerability research、high-scale scanning、malware analysis、threat intelligence，也可能造成真实世界伤害。

这些 capabilities 和 techniques 应该在能改善安全的场景中可用，并且更容易使用。OpenAI 的 Trusted Access for Cyber pilot 允许 individuals 和 organizations 在不中断的情况下，继续把 models 用于 potentially high-risk cybersecurity activity。

How it works

从事 cybersecurity-related work，或从事可能被 automated detection systems mistaken 的类似活动的 developers 和 security professionals，requests 可能会 fallback reroute 到 GPT-5.2。

OpenAI 预计只有很小一部分 traffic 会受到 mitigations 影响，并正在校准 policies 和 classifiers。

最新 alpha 版本的 Codex CLI 已经包含 request 被 reroute 时的 in-product messaging。未来几天内，所有 clients 都会支持这类 messaging。

受到 mitigations 影响的 accounts，可以通过加入下面的 Trusted Access program，恢复 GPT-5.3-Codex access。

OpenAI 也承认，加入 Trusted Access 不一定适合所有人。因此随着 mitigations 扩大和 strengthen cyber resilience，OpenAI 计划在多数情况下从 account-level safety checks 转向 request-level checks。

Trusted Access for Cyber

OpenAI 正在试点 "trusted access"，让 developers 在 OpenAI 继续校准 policies 和 classifiers、准备 general availability 的同时，保留 advanced capabilities。

目标是让需要加入 Trusted Access for Cyber 的 users 非常少。

要把 models 用于 potentially high-risk cybersecurity work：

Users 可以在 chatgpt.com/cyber 验证 identity。
Enterprises 可以通过 OpenAI representative，为整个团队默认申请 trusted access。

可能需要更 cyber-capable 或更 permissive models 来加速 legitimate defensive work 的 security researchers 和 teams，可以表达加入 invite-only program 的兴趣。

拥有 trusted access 的 users 仍必须遵守 Usage Policies 和 Terms of Use。

False positives

Legitimate 或 non-cybersecurity activity 偶尔也可能被 flagged。

发生 rerouting 时，responding model 会在 API request logs 中可见，并在 CLI 中显示 in-product notice；很快所有 surfaces 都会支持。

如果你认为遇到的 rerouting 是错误的，请通过 /feedback 报告 false positives。

新手最小化开网络的做法

新手配网络时按一句话原则走：默认全关，要用才开，开了限域名，用完收回。

默认关闭：大多数任务用本地文件和缓存就够，不需要联网。
按需最小开：确实要联网时，只放行必需的域名，不开放全网。
读写分级：只读访问相对安全，写请求（POST 等）要更谨慎、单独确认。
用完收回：任务做完把临时放开的网络权限关回去，不留长期口子。

拿不准时，宁可先关着跑一遍看缺什么，再精准补，而不是图省事一次全开。