Codex CLI 模型选择指南(2026):o4-mini vs GPT-4.1 vs GPT-5 完整对比

选对模型能让你的 Codex CLI 成本降低 80%、速度提升 3 倍,同时不牺牲任务完成质量。本文全面对比当前可用的所有模型,给出按任务类型的具体推荐,并展示如何在配置文件或命令行中快速切换。

当前可用模型总览

Codex CLI 支持 OpenAI 平台上的所有模型。截至 2026 年,最常用的模型如下:

模型 ID别名定位上下文窗口
codex-mini-latest o4-mini(默认) 推理能力强、成本适中 200K tokens
gpt-4.1 GPT-4.1 速度最快、成本最低 1M tokens
gpt-4.1-mini GPT-4.1 Mini 极低成本、适合简单任务 1M tokens
o3 o3 深度推理、复杂问题 200K tokens
o4-mini-high o4-mini High 高推理预算版本 200K tokens

Codex CLI 的默认模型是 codex-mini-latest,即 o4-mini。绝大多数情况下这是最佳选择——除非你有特定的性能或成本需求。

模型性能 & 成本对比

模型代码能力推理能力响应速度Input 成本Output 成本
o4-mini 默认 ★★★★☆ ★★★★★ ★★★☆☆ $1.1 / 1M $4.4 / 1M
GPT-4.1 ★★★★☆ ★★★☆☆ ★★★★★ $2.0 / 1M $8.0 / 1M
GPT-4.1 Mini ★★★☆☆ ★★☆☆☆ ★★★★★ $0.4 / 1M $1.6 / 1M
o3 ★★★★★ ★★★★★ ★★☆☆☆ $10.0 / 1M $40.0 / 1M
o4-mini-high ★★★★★ ★★★★★ ★★★☆☆ $1.1 / 1M $4.4 / 1M

价格为近似值,以 OpenAI 官网最新定价为准。实际费用因推理 token 开销而异。

o4-mini(默认):最佳综合选择

推荐场景:日常 Codex CLI 使用、CI/CD 任务、多步骤重构、AGENTS.md 配合使用。

o4-mini 是 Codex CLI 的默认模型,也是绝大多数用户的最佳选择。它是一个推理型(Reasoning)模型,在接到复杂任务时会先"思考"几步再行动,这使它在以下方面明显优于 GPT-4.1:

  • 多文件重构(需要理解文件之间的依赖关系)
  • CI/CD 自动化任务(需要规划执行步骤)
  • 调试复杂 bug(需要追踪错误根因)
  • 理解大型代码库结构(需要整体推理)

成本适中($1.1/$4.4 per 1M tokens),SWE-bench 表现优秀。如果你不确定该用哪个模型,就用 o4-mini。

查看当前默认模型
$ codex --version  # 查看版本
$ codex            # 默认使用 codex-mini-latest (o4-mini)

GPT-4.1:速度与性价比

推荐场景:快速代码补全、大文件处理、简单任务批处理、需要最快响应的场景。

GPT-4.1 的最大优势是速度最快 + 上下文窗口最大(1M tokens)。它不是推理型模型,会直接生成输出而不先"思考",所以对于简单、明确的任务反而比 o4-mini 更快更经济:

  • 修改单个函数或方法(任务明确)
  • 添加注释、调整格式(无需推理)
  • 处理非常大的代码文件(需要 1M 上下文窗口)
  • 快速问答和代码解释

注意:GPT-4.1 的 Input 成本($2.0 / 1M)比 o4-mini($1.1 / 1M)更贵,但因为不需要推理 token,实际任务总成本可能差不多甚至更低。

使用 GPT-4.1
$ codex --model gpt-4.1
$ codex exec --model gpt-4.1 "为所有函数添加 JSDoc 注释"

GPT-4.1 Mini:最低成本选项

推荐场景:简单脚本、格式化、日志分析、成本极敏感的自动化任务。

GPT-4.1 Mini 是目前 Codex CLI 可用模型中成本最低的($0.4 / 1M input),适合不需要复杂推理的批量操作任务。但对于需要理解上下文、做决策的任务,建议换回 o4-mini。

使用 GPT-4.1 Mini
$ codex exec --model gpt-4.1-mini "统一所有文件的缩进为 2 空格"

o3:最强推理,高成本

推荐场景:极度复杂的架构重设计、跨模块依赖分析、安全漏洞深度排查。

o3 是 OpenAI 推理能力最强的模型之一,但成本也是最高的($10 / 1M input,约为 o4-mini 的 9 倍)。一般的 Codex CLI 任务没有必要用 o3——除非你遇到了 o4-mini 明显处理不好的超复杂场景。

!

成本提醒:o3 用于长代码库任务时,单次成本可能超过 $1–5。在 CI/CD 或批量任务中使用前,强烈建议先做小范围测试。

按任务类型选择模型

任务类型推荐模型原因
CI/CD 自动化(GitHub Actions) o4-mini 推理+计划能力,成本可控
多文件重构 o4-mini 需要理解文件间依赖
单函数修改 / 小任务 GPT-4.1 更快,不需要推理
批量格式化 / 注释 GPT-4.1 Mini 最低成本,任务简单
大文件(>50万 tokens) GPT-4.1 1M 上下文窗口
Debug 复杂 bug o4-mini 或 o4-mini-high 推理型模型更擅长追踪根因
架构重设计 / 超复杂任务 o3 最强推理,仅在必要时用

如何配置模型

方法 1:config.toml(持久默认)

~/.codex/config.toml 中设置默认模型,之后每次启动 Codex 都会使用该模型:

~/.codex/config.toml
model = "gpt-4.1"
# 可选值:codex-mini-latest, gpt-4.1, gpt-4.1-mini, o3, o4-mini-high

方法 2:命令行参数(临时覆盖)

在单次调用时通过 --model 参数临时指定模型,不影响全局配置:

命令行指定模型
# 交互模式
$ codex --model gpt-4.1

# 非交互模式(codex exec)
$ codex exec --model o4-mini-high "重构认证模块"

# CI/CD 环境(推荐用环境变量)
$ CODEX_MODEL=gpt-4.1-mini codex exec "统一代码风格"

方法 3:AGENTS.md 指定(项目级)

在项目的 AGENTS.md 中可以建议使用的模型,让 Codex 在每次处理该项目时使用指定配置:

AGENTS.md 示例
# 项目级模型建议(不强制,Codex 会尊重但可被命令行覆盖)
preferred_model: o4-mini-high

## 项目背景
这是一个金融合规系统,代码准确性要求极高,建议使用推理能力更强的模型。

详细的 AGENTS.md 写法参考:AGENTS.md 完整指南

模型成本优化技巧

任务分层策略

不同任务使用不同模型是最直接的省钱方法。一个典型的 CI/CD pipeline 可以这样分配:

GitHub Actions 分层模型示例
# 简单任务:GPT-4.1 Mini(最省钱)
codex exec --model gpt-4.1-mini "检查所有文件的代码风格,输出不符合规范的文件列表"

# 中等任务:o4-mini(默认,性价比最高)
codex exec "分析测试失败的根因并提供修复建议"

# 复杂任务:o4-mini-high(需要更深推理)
codex exec --model o4-mini-high "重构认证模块,同时保持向后兼容性"

用 --quiet 减少 token 消耗

在 CI/CD 等非交互场景中,加上 --quiet 可以减少不必要的输出 token:

减少输出消耗
$ codex exec --quiet "修复 lint 错误"  # 减少解释性文字的 token 消耗

通过 max_tokens 设置输出上限

对于只需要简短输出的任务,可以在 config.toml 中限制最大输出 token:

~/.codex/config.toml
model = "gpt-4.1-mini"
max_tokens = 4096  # 对于简单任务,4096 已经足够

更多省钱策略参考:价格与收费完整指南

🦙 想彻底省掉 API 费用? Codex CLI 支持通过 Ollama 接入本地模型(Qwen2.5-Coder、DeepSeek-Coder 等),实现零成本、离线编程。 查看 Ollama 本地模型完整配置指南

常见问题

Codex CLI 默认使用哪个模型?

默认模型是 codex-mini-latest,即 o4-mini。这是推理能力、成本和速度三者之间的最优平衡点,适合绝大多数日常任务。

o4-mini 和 GPT-4.1 哪个更适合 Codex?

取决于任务复杂度。o4-mini 适合需要推理和多步骤规划的复杂任务(重构、CI/CD、bug 追踪);GPT-4.1 适合简单、明确的快速任务(格式化、单函数修改)。大多数 Codex 用户 o4-mini 是更好的默认选择。

如何切换模型?

两种方式:① 在 ~/.codex/config.toml 设置 model = "gpt-4.1" 作为全局默认;② 用 --model 参数临时指定:codex --model gpt-4.1codex exec --model o3 "..."

GPT-5 什么时候能在 Codex CLI 中使用?

OpenAI 持续更新可用模型列表。当 GPT-5 系列正式开放 API 访问后,可以在 Codex CLI 的 --model 参数中直接使用对应的模型 ID。关注 OpenAI API 页面获取最新可用模型列表。

订阅版 Codex 和 API 计费版用的是同一个模型吗?

订阅版(ChatGPT Plus/Pro 中的 Codex)使用的模型由 OpenAI 管理,通常比 API 版有更严格的使用限额。API 计费版可以完全自由切换模型并精确控制成本,更灵活但需要自己管理费用。