理解网络安全边界
这些 safeguards 包括训练模型拒绝明显 malicious requests,例如窃取 credentials。
📖 本篇术语速查表
| 英文 / 缩写 | 中文 | 一句话解释 |
|---|---|---|
| 网络边界 | network boundary | 限定 Codex 能访问哪些外部地址。 |
| Trusted access | 受信访问 | 经核验的安全网络访问机制。 |
| False positive | 误报 | 安全机制错拦了正常访问。 |
不想读完?把下面这段提示词丢给 AI 帮你跑完——帮你配好网络安全边界,并处理误报。
你是 Codex 网络安全边界顾问,帮我按最小化原则配好网络访问并处理误报。
【角色】
你理解网络安全机制为什么这么做、它怎么工作、trusted access 的作用、误报怎么处理。
【输入】
- 任务为什么要联网:___
- 涉及的外部地址 / 服务:___
- 是否处理敏感数据:___
- 遇到过的拦截 / 误报:___
【工作流程】
1. 判断联网是否必需、能否替代
2. 按最小化配网络边界(限域名)
3. 说明 trusted access 怎么用
4. 给误报的判断和处理
【输出规范】
▌一、是否必需联网 + 替代方案
▌二、最小化网络边界配置
▌三、trusted access 使用
▌四、误报判断与处理
【硬约束】
- 网络默认关,按需开、限域名、用完收回
- 写请求比读请求更严格
- 敏感数据防外泄
- 误报不靠关掉安全机制来"解决"
- 不确定的机制标注需查官方文档GPT-5.3-Codex 是 OpenAI 按 Preparedness Framework 作为 High cybersecurity capability 对待的第一个模型,因此需要额外 safeguards。
这些 safeguards 包括训练模型拒绝明显 malicious requests,例如窃取 credentials。
除了 safety training,OpenAI 还使用 automated classifier-based monitors 检测 suspicious cyber activity signals,并把 high-risk traffic 路由到 cyber capability 较低的模型,也就是 GPT-5.2。
OpenAI 预期只有很小一部分 traffic 会受到这些 mitigations 影响,并且正在持续完善 policies、classifiers 和 in-product notifications。
Why we’re doing this
过去几个月,模型在 cybersecurity tasks 上的能力有明显提升,这对 developers 和 security professionals 都有价值。
随着模型越来越擅长 vulnerability discovery 这类 cybersecurity-related tasks,OpenAI 采取 precautionary approach:扩大 protections 和 enforcement,在支持 legitimate research 的同时减缓 misuse。
Cyber capabilities 天然是 dual-use。支撑重要 defensive work 的同一套知识和技术,例如 penetration testing、vulnerability research、high-scale scanning、malware analysis、threat intelligence,也可能造成真实世界伤害。
这些 capabilities 和 techniques 应该在能改善安全的场景中可用,并且更容易使用。OpenAI 的 Trusted Access for Cyber pilot 允许 individuals 和 organizations 在不中断的情况下,继续把 models 用于 potentially high-risk cybersecurity activity。
How it works
从事 cybersecurity-related work,或从事可能被 automated detection systems mistaken 的类似活动的 developers 和 security professionals,requests 可能会 fallback reroute 到 GPT-5.2。
OpenAI 预计只有很小一部分 traffic 会受到 mitigations 影响,并正在校准 policies 和 classifiers。
最新 alpha 版本的 Codex CLI 已经包含 request 被 reroute 时的 in-product messaging。未来几天内,所有 clients 都会支持这类 messaging。
受到 mitigations 影响的 accounts,可以通过加入下面的 Trusted Access program,恢复 GPT-5.3-Codex access。
OpenAI 也承认,加入 Trusted Access 不一定适合所有人。因此随着 mitigations 扩大和 strengthen cyber resilience,OpenAI 计划在多数情况下从 account-level safety checks 转向 request-level checks。
Trusted Access for Cyber
OpenAI 正在试点 "trusted access",让 developers 在 OpenAI 继续校准 policies 和 classifiers、准备 general availability 的同时,保留 advanced capabilities。
目标是让需要加入 Trusted Access for Cyber 的 users 非常少。
要把 models 用于 potentially high-risk cybersecurity work:
- Users 可以在 chatgpt.com/cyber 验证 identity。
- Enterprises 可以通过 OpenAI representative,为整个团队默认申请 trusted access。
可能需要更 cyber-capable 或更 permissive models 来加速 legitimate defensive work 的 security researchers 和 teams,可以表达加入 invite-only program 的兴趣。
拥有 trusted access 的 users 仍必须遵守 Usage Policies 和 Terms of Use。
False positives
Legitimate 或 non-cybersecurity activity 偶尔也可能被 flagged。
发生 rerouting 时,responding model 会在 API request logs 中可见,并在 CLI 中显示 in-product notice;很快所有 surfaces 都会支持。
如果你认为遇到的 rerouting 是错误的,请通过 /feedback 报告 false positives。
新手最小化开网络的做法
新手配网络时按一句话原则走:默认全关,要用才开,开了限域名,用完收回。
- 默认关闭:大多数任务用本地文件和缓存就够,不需要联网。
- 按需最小开:确实要联网时,只放行必需的域名,不开放全网。
- 读写分级:只读访问相对安全,写请求(POST 等)要更谨慎、单独确认。
- 用完收回:任务做完把临时放开的网络权限关回去,不留长期口子。
拿不准时,宁可先关着跑一遍看缺什么,再精准补,而不是图省事一次全开。