当前可用模型总览
Codex CLI 支持 OpenAI 平台上的所有模型。截至 2026 年,最常用的模型如下:
| 模型 ID | 别名 | 定位 | 上下文窗口 |
|---|---|---|---|
codex-mini-latest |
o4-mini(默认) | 推理能力强、成本适中 | 200K tokens |
gpt-4.1 |
GPT-4.1 | 速度最快、成本最低 | 1M tokens |
gpt-4.1-mini |
GPT-4.1 Mini | 极低成本、适合简单任务 | 1M tokens |
o3 |
o3 | 深度推理、复杂问题 | 200K tokens |
o4-mini-high |
o4-mini High | 高推理预算版本 | 200K tokens |
Codex CLI 的默认模型是 codex-mini-latest,即 o4-mini。绝大多数情况下这是最佳选择——除非你有特定的性能或成本需求。
模型性能 & 成本对比
| 模型 | 代码能力 | 推理能力 | 响应速度 | Input 成本 | Output 成本 |
|---|---|---|---|---|---|
| o4-mini 默认 | ★★★★☆ | ★★★★★ | ★★★☆☆ | $1.1 / 1M | $4.4 / 1M |
| GPT-4.1 | ★★★★☆ | ★★★☆☆ | ★★★★★ | $2.0 / 1M | $8.0 / 1M |
| GPT-4.1 Mini | ★★★☆☆ | ★★☆☆☆ | ★★★★★ | $0.4 / 1M | $1.6 / 1M |
| o3 | ★★★★★ | ★★★★★ | ★★☆☆☆ | $10.0 / 1M | $40.0 / 1M |
| o4-mini-high | ★★★★★ | ★★★★★ | ★★★☆☆ | $1.1 / 1M | $4.4 / 1M |
价格为近似值,以 OpenAI 官网最新定价为准。实际费用因推理 token 开销而异。
o4-mini(默认):最佳综合选择
推荐场景:日常 Codex CLI 使用、CI/CD 任务、多步骤重构、AGENTS.md 配合使用。
o4-mini 是 Codex CLI 的默认模型,也是绝大多数用户的最佳选择。它是一个推理型(Reasoning)模型,在接到复杂任务时会先"思考"几步再行动,这使它在以下方面明显优于 GPT-4.1:
- 多文件重构(需要理解文件之间的依赖关系)
- CI/CD 自动化任务(需要规划执行步骤)
- 调试复杂 bug(需要追踪错误根因)
- 理解大型代码库结构(需要整体推理)
成本适中($1.1/$4.4 per 1M tokens),SWE-bench 表现优秀。如果你不确定该用哪个模型,就用 o4-mini。
$ codex --version # 查看版本
$ codex # 默认使用 codex-mini-latest (o4-mini)
GPT-4.1:速度与性价比
推荐场景:快速代码补全、大文件处理、简单任务批处理、需要最快响应的场景。
GPT-4.1 的最大优势是速度最快 + 上下文窗口最大(1M tokens)。它不是推理型模型,会直接生成输出而不先"思考",所以对于简单、明确的任务反而比 o4-mini 更快更经济:
- 修改单个函数或方法(任务明确)
- 添加注释、调整格式(无需推理)
- 处理非常大的代码文件(需要 1M 上下文窗口)
- 快速问答和代码解释
注意:GPT-4.1 的 Input 成本($2.0 / 1M)比 o4-mini($1.1 / 1M)更贵,但因为不需要推理 token,实际任务总成本可能差不多甚至更低。
$ codex --model gpt-4.1
$ codex exec --model gpt-4.1 "为所有函数添加 JSDoc 注释"
GPT-4.1 Mini:最低成本选项
推荐场景:简单脚本、格式化、日志分析、成本极敏感的自动化任务。
GPT-4.1 Mini 是目前 Codex CLI 可用模型中成本最低的($0.4 / 1M input),适合不需要复杂推理的批量操作任务。但对于需要理解上下文、做决策的任务,建议换回 o4-mini。
$ codex exec --model gpt-4.1-mini "统一所有文件的缩进为 2 空格"
o3:最强推理,高成本
推荐场景:极度复杂的架构重设计、跨模块依赖分析、安全漏洞深度排查。
o3 是 OpenAI 推理能力最强的模型之一,但成本也是最高的($10 / 1M input,约为 o4-mini 的 9 倍)。一般的 Codex CLI 任务没有必要用 o3——除非你遇到了 o4-mini 明显处理不好的超复杂场景。
成本提醒:o3 用于长代码库任务时,单次成本可能超过 $1–5。在 CI/CD 或批量任务中使用前,强烈建议先做小范围测试。
按任务类型选择模型
| 任务类型 | 推荐模型 | 原因 |
|---|---|---|
| CI/CD 自动化(GitHub Actions) | o4-mini | 推理+计划能力,成本可控 |
| 多文件重构 | o4-mini | 需要理解文件间依赖 |
| 单函数修改 / 小任务 | GPT-4.1 | 更快,不需要推理 |
| 批量格式化 / 注释 | GPT-4.1 Mini | 最低成本,任务简单 |
| 大文件(>50万 tokens) | GPT-4.1 | 1M 上下文窗口 |
| Debug 复杂 bug | o4-mini 或 o4-mini-high | 推理型模型更擅长追踪根因 |
| 架构重设计 / 超复杂任务 | o3 | 最强推理,仅在必要时用 |
如何配置模型
方法 1:config.toml(持久默认)
在 ~/.codex/config.toml 中设置默认模型,之后每次启动 Codex 都会使用该模型:
model = "gpt-4.1"
# 可选值:codex-mini-latest, gpt-4.1, gpt-4.1-mini, o3, o4-mini-high
方法 2:命令行参数(临时覆盖)
在单次调用时通过 --model 参数临时指定模型,不影响全局配置:
# 交互模式
$ codex --model gpt-4.1
# 非交互模式(codex exec)
$ codex exec --model o4-mini-high "重构认证模块"
# CI/CD 环境(推荐用环境变量)
$ CODEX_MODEL=gpt-4.1-mini codex exec "统一代码风格"
方法 3:AGENTS.md 指定(项目级)
在项目的 AGENTS.md 中可以建议使用的模型,让 Codex 在每次处理该项目时使用指定配置:
# 项目级模型建议(不强制,Codex 会尊重但可被命令行覆盖)
preferred_model: o4-mini-high
## 项目背景
这是一个金融合规系统,代码准确性要求极高,建议使用推理能力更强的模型。
详细的 AGENTS.md 写法参考:AGENTS.md 完整指南。
模型成本优化技巧
任务分层策略
不同任务使用不同模型是最直接的省钱方法。一个典型的 CI/CD pipeline 可以这样分配:
# 简单任务:GPT-4.1 Mini(最省钱)
codex exec --model gpt-4.1-mini "检查所有文件的代码风格,输出不符合规范的文件列表"
# 中等任务:o4-mini(默认,性价比最高)
codex exec "分析测试失败的根因并提供修复建议"
# 复杂任务:o4-mini-high(需要更深推理)
codex exec --model o4-mini-high "重构认证模块,同时保持向后兼容性"
用 --quiet 减少 token 消耗
在 CI/CD 等非交互场景中,加上 --quiet 可以减少不必要的输出 token:
$ codex exec --quiet "修复 lint 错误" # 减少解释性文字的 token 消耗
通过 max_tokens 设置输出上限
对于只需要简短输出的任务,可以在 config.toml 中限制最大输出 token:
model = "gpt-4.1-mini"
max_tokens = 4096 # 对于简单任务,4096 已经足够
更多省钱策略参考:价格与收费完整指南。
常见问题
Codex CLI 默认使用哪个模型?
默认模型是 codex-mini-latest,即 o4-mini。这是推理能力、成本和速度三者之间的最优平衡点,适合绝大多数日常任务。
o4-mini 和 GPT-4.1 哪个更适合 Codex?
取决于任务复杂度。o4-mini 适合需要推理和多步骤规划的复杂任务(重构、CI/CD、bug 追踪);GPT-4.1 适合简单、明确的快速任务(格式化、单函数修改)。大多数 Codex 用户 o4-mini 是更好的默认选择。
如何切换模型?
两种方式:① 在 ~/.codex/config.toml 设置 model = "gpt-4.1" 作为全局默认;② 用 --model 参数临时指定:codex --model gpt-4.1 或 codex exec --model o3 "..."。
GPT-5 什么时候能在 Codex CLI 中使用?
OpenAI 持续更新可用模型列表。当 GPT-5 系列正式开放 API 访问后,可以在 Codex CLI 的 --model 参数中直接使用对应的模型 ID。关注 OpenAI API 页面获取最新可用模型列表。
订阅版 Codex 和 API 计费版用的是同一个模型吗?
订阅版(ChatGPT Plus/Pro 中的 Codex)使用的模型由 OpenAI 管理,通常比 API 版有更严格的使用限额。API 计费版可以完全自由切换模型并精确控制成本,更灵活但需要自己管理费用。