总评:4.1 / 5
✅ 核心优势
- SWE-bench 跑分业内领先(88.7%)
- API 计费比 Claude Code 便宜 2.5–4×
- 内置
codex exec,CI/CD 集成最便捷 - 有 Free 方案,门槛低
- 部分开源,社区活跃
- AGENTS.md 项目记忆机制完善
⚠️ 主要不足
- 人工感知代码质量不如 Claude Code
- 国内必须配代理,首次设置有门槛
- 纯终端工具,无 IDE 内嵌
- 复杂任务 API 成本可能超预期
- 连接不稳定时排错成本较高
一句话结论:Codex CLI 是目前自动化能力最强、成本最优的终端 AI 编程工具之一,特别适合 CI/CD 自动化和批量代码任务。如果你的工作流强依赖人工 code review,代码质量优先场景考虑 Claude Code。
Codex CLI 是什么
OpenAI Codex CLI(@openai/codex)是 OpenAI 于 2025 年推出的开源终端 AI Agent,运行在本地命令行,支持读取代码文件、执行 shell 命令、多文件重构。与 ChatGPT 或 GitHub Copilot 不同,它的定位是能够自主完成任务的代码 Agent,而非行内补全辅助工具。
核心能力:
- 在终端内与 AI 进行多轮对话,AI 可读取项目文件、执行命令
- 通过
codex exec实现完全非交互式自动化,适合 CI/CD - 通过
AGENTS.md为项目设置持久记忆,AI 始终理解项目背景 - 支持沙箱模式,控制 AI 的操作权限范围
- 支持多种 OpenAI 模型(GPT-4.1、o4-mini、GPT-5.x 等)
更详细的功能介绍参考:Codex CLI 是什么。
性能与基准测试
以下数据截至 2026 年,可能随版本更新而变化:
| 基准测试 | Codex / GPT-5.5 | 对比 | 备注 |
|---|---|---|---|
| SWE-bench Verified | 88.7% | Claude Code 87.6%(领先 1.1%) | 真实 GitHub Issue 自动修复率 |
| Terminal-Bench | 82.7%(GPT-5.5) | 终端操作专项基准 | 命令执行、文件操作等 |
| 人工代码质量评审 | 25%("更整洁") | Claude Code 67% | 双盲评审,Express.js 重构任务 |
| 同任务 API 成本 | ~$15 | Claude Code ~$155 | 同一重构任务,实际成本因任务而异 |
解读:Codex CLI 在自动化完成率(SWE-bench)上是业内最高水准,但人工代码质量感知明显落后于 Claude Code。这意味着它更适合自动化流水线(结果可被测试验证),不适合代码直接进生产前的质量把关。
价格评估
| 方案 | 价格 | 适用人群 |
|---|---|---|
| Free | $0 | 尝鲜、轻度使用 |
| Go | $8/月 | 个人开发者、副业项目 |
| Plus | $20/月 | 日常开发主力工具 |
| Pro | $100/月 | 高频使用、需要 GPT-5.5 Pro |
| API 按量 | 约为 Claude Code 的 1/2.5–1/4 | CI/CD 自动化、成本可预测 |
价格合理性:中等偏高。订阅制方案在功能上是值得的,特别是有 Free 方案起步的选项让决策成本极低。API 计费方面相比 Claude Code 有明显优势。但与免费的 GitHub Copilot 学生版或有补贴的企业方案相比,需要考虑性价比。
详细价格与省钱方法参考:价格与收费完整指南。
上手体验
安装
安装本身非常简单,一行命令搞定:
$ npm install -g @openai/codex
需要 Node.js 18+,macOS / Linux 均支持,Windows 需要 WSL2。
国内的障碍
这是目前最大的上手门槛。国内无法直连 OpenAI API,需要配置代理:
export HTTPS_PROXY="http://127.0.0.1:7890"
export HTTP_PROXY="http://127.0.0.1:7890"
配置好代理后使用完全正常,但这道门槛过滤掉了很多潜在用户。详细配置参考:国内代理配置指南。
AGENTS.md 学习曲线
基础使用(打开 Codex、输入任务、查看结果)非常直观,5 分钟上手。但要真正发挥 Codex 的潜力,需要学会写 AGENTS.md 和精确 Prompt——这大约需要一周的实际使用才能摸到感觉。
适合谁,不适合谁
✅ 非常适合
- 有 CI/CD 自动化需求的团队:
codex exec+ GitHub Actions 是 Codex 的最强应用场景,成本低、效果好 - 需要批量处理代码的独立开发者:统一重构、加注释、迁移依赖版本——重复性任务
- API 成本敏感的工程师:相比 Claude Code,同样的任务便宜 2.5–4 倍
- 喜欢开源工具的开发者:Codex CLI 有公开 GitHub 仓库,可以贡献代码
- 需要深入理解大型代码库的场景:通过 AGENTS.md 和上下文窗口,可以把整个项目背景告诉 Codex
⚠️ 不太适合
- 完全不想折腾代理的用户:国内不配代理就不能用,这是硬门槛
- 代码质量高度敏感、每行都需要人工审查的场景:Claude Code 的输出在人工评审中更受认可
- 希望在 IDE 内使用 AI 补全的用户:Codex CLI 是纯终端工具,不嵌入 VS Code 或 JetBrains
- 初学编程、没有基础的用户:上手门槛比 GitHub Copilot 高,需要懂终端操作
与主要竞品对比
| 工具 | 最适合场景 | 主要优势 | 主要劣势 |
|---|---|---|---|
| Codex CLI | CI/CD 自动化、批量任务 | 低成本、强自动化、SWE-bench 第一 | 国内需代理、质量感知一般 |
| Claude Code | 安全审计、质量优先的生产代码 | 代码整洁度高、长上下文无溢价 | 成本高、同样需代理 |
| GitHub Copilot | IDE 内实时补全 | IDE 集成、新手友好 | 自主任务能力弱、订阅必付费 |
| Cursor | GUI 偏好开发者 | 完整 IDE 体验、UI 友好 | 较贵、不适合 CI/CD |
| Aider | 多模型灵活切换 | 开源、支持本地模型 | 无官方支持、设置复杂 |
真实使用感受
做得好的地方
codex exec 是真的好用。把它接入 GitHub Actions 后,每次 PR 合入都能自动生成 Changelog 条目、自动补测试、自动修 lint 错误——这些重复性任务以前要消耗大量时间,现在基本自动化了。成本也比预期低。
AGENTS.md 一旦写好,效果倍增。第一次用时觉得每次要重新解释项目背景很烦,写了 AGENTS.md 之后 Codex 真的记住了项目结构和规范,不再需要重复解释。
交互体验流畅。终端 UI 设计得比较简洁,diff 展示清晰,审批流程不烦人。
不够好的地方
代码质量的感知差距是真实的。在写新功能时,Codex 产出的代码能跑通、结构合理,但风格比 Claude Code 更「机械」——变量命名不够语义化,有时会选择更冗长的写法。盲评数据(25% vs 67%)是有依据的。
国内配置门槛真实存在。代理设置不当会导致一直 Reconnecting,排查过程对不熟悉网络配置的开发者很痛苦。参考本站的 Reconnecting 排查指南可以大幅减少这部分时间。
对于大型复杂任务,需要自己拆解。直接扔一个"重构整个认证模块"的任务,Codex 会因为上下文不够或任务太模糊而输出不理想。需要自己把任务拆成明确的小步骤。这不是 Codex 的问题,而是任何 AI 工具的通病——学会拆任务是必要的技能。
结论:要不要用?
推荐使用,如果你满足以下任一条件:
① 有 CI/CD 自动化需求 ② 日常代码量大、需要批量处理 ③ API 成本是重要考量 ④ 愿意投入时间配置代理和 AGENTS.md
谨慎使用,如果:
① 不愿意配置代理 ② 对代码输出风格极度敏感 ③ 主要场景是 IDE 内实时补全而非自主任务执行
从总体来看,Codex CLI 在 2026 年是一款成熟可用的工具,但不是"对所有人都完美"的工具。如果你的核心需求是把 AI 接入自动化流水线,它几乎是最优选择。如果你主要需要代码质量评审辅助,Claude Code 可能更合适。
决定尝试?从 安装 Codex CLI 开始,5 分钟完成安装;遇到连接问题查看 Reconnecting 排查指南;想最大化使用效果参考 实用技巧与进阶用法。
常见问题
Codex CLI 值得付费吗?
对于有 CI/CD 自动化需求、日常代码量大的开发者,按 API 计费方案通常值得——成本一般在 $5–30/月之间,具体取决于使用量。订阅制从 $8/月起,适合个人开发者。如果只是轻度探索,免费额度可能就够用。
Codex CLI 和 GitHub Copilot 哪个更适合新手?
GitHub Copilot 对新手更友好——IDE 内嵌入、实时行内补全、无需配置代理。Codex CLI 上手门槛略高,但功能更强大(可自主执行命令和多文件任务)。建议新手从 Copilot 或 Cursor 开始,有需要后再上 Codex。
Codex CLI 在国内能用吗?
能用,但需要配置 HTTP/HTTPS 代理。国内无法直连 OpenAI API,配置好代理后完全正常使用。具体配置步骤参考 国内代理配置指南。
Codex CLI 2026 有哪些主要缺点?
主要缺点:① 国内需要代理;② 纯终端工具,无 IDE 内嵌;③ 复杂任务 API 成本可能超预期;④ 人工感知代码质量不如 Claude Code(25% vs 67%);⑤ 首次设置(代理、AGENTS.md)有学习曲线。