AI摘要

本文是一份关于OpenAI Codex的使用研究与插件/MCP实战指南,适用于有成熟工程体系、数据库和业务系统经验的开发者/架构师。Codex是OpenAI面向软件工程的AI编程代理,具备代码阅读、修改、运行命令、代码审查等功能。文章详细介绍了Codex的安装方式、核心能力、使用技巧、插件概念、MCP扩展机制、插件开发概要以及面向KDOBSS/AI客服的推荐Codex架构。同时,文章还提供了安全与权限建议和推荐日常工作流,旨在帮助开发者更好地利用Codex提高软件工程效率。

OpenAI Codex 使用研究与插件/MCP 实战指南

codex使用技巧

适用对象:有成熟工程体系、数据库和业务系统经验的开发者/架构师
说明:本文基于 OpenAI 官方文档、OpenAI Codex GitHub 仓库、MCP 官方规范、MCP 目录站和公开社区资料整理。Codex 插件目前没有公开的全球真实安装量/调用量榜单,所以“使用量最多”部分分为两类:一类是有公开榜单数据支撑的 MCP server 排名;另一类是结合 OpenAI 官方推荐、当前 Codex 插件生态和软件工程高频工作流整理的“高频实战插件/集成推荐”。

1. 一句话理解 Codex

Codex 是 OpenAI 面向软件工程的 AI coding agent。它可以在本地 CLI、IDE、Codex 桌面 App、ChatGPT/Codex Web 和云端环境中读取代码、修改代码、运行命令、做代码审查、拆分任务、调用外部工具,并把结果整理成可 review 的 diff、报告或 PR。

官方定位可以概括为三层:

  1. 本地结对编程:在终端或 IDE 中,让 Codex 读项目、改文件、跑测试。
  2. 云端委派任务:把较长的修复、迁移、重构、代码审查任务交给隔离环境中的 Codex agent。
  3. 多工具/多 agent 工作流:通过插件、Skills、MCP、Subagents、浏览器、GitHub 等能力,把 Codex 变成工程自动化中枢。

2. 官方入口与安装方式

2.1 Codex CLI

OpenAI 官方 CLI 文档说明:Codex CLI 是可以在本地终端运行的 coding agent,能够在选定目录中读取、修改和运行代码,并且是开源项目。

常用安装方式:

npm i -g @openai/codex
codex

Windows 也可以使用官方安装脚本:

powershell -ExecutionPolicy ByPass -c "irm https://chatgpt.com/codex/install.ps1 | iex"

升级:

npm i -g @openai/codex@latest

首次运行时可以选择用 ChatGPT 账号登录,也可以使用 OpenAI API key。官方 GitHub README 也列出了 npm、Homebrew、安装脚本和 GitHub release 二进制包等安装方式。

2.2 Codex App / IDE / Web

Codex 当前不是单一 CLI 工具,而是一组 coding agent 入口:

入口适合场景
Codex CLI本地工程、终端操作、脚本化、快速改代码
IDE ExtensionVS Code、Cursor、Windsurf 等编辑器内结对开发
Codex App多项目、多 worktree、多 agent 管理,适合桌面工作台
Codex Web / ChatGPT 中的 Codex云端委派任务、后台跑长任务、PR/Issue 类工作
Codex SDK / GitHub Action自动化、CI、批处理、工程流水线

3. Codex 的核心能力

3.1 代码理解

让 Codex 先读代码,而不是直接改代码,适合接手遗留系统、定位复杂业务链路:

请先不要修改代码。阅读这个仓库,整理:
1. 主要模块和目录职责
2. 数据库访问层在哪里
3. 登录、计费、客户状态变更的关键流程
4. 你认为最适合开始改动的文件

3.2 代码修改与测试

适合明确目标的小步迭代:

修复客户状态同步中的空值异常。范围限制在 billing/customer-sync 相关文件。
保持现有数据库表结构不变。修改后运行相关测试,并说明你改了什么。

3.3 代码审查

Codex 很适合在提交前做一次独立 review:

请 review 当前分支相对 main 的改动,重点看:
1. 数据一致性风险
2. SQL 注入或权限绕过
3. 并发更新问题
4. 缺失测试
只输出高风险和中风险问题,带文件位置和建议修复方式。

3.4 多 agent 并行

官方 Subagents 文档说明,Codex 可以在明确要求时启动多个专门 agent 并行执行,再汇总结果。适合大型代码库探索、PR 多维 review、迁移方案评估。

示例:

请为当前 PR 启动 4 个 subagent 并行审查:
1. 安全问题
2. 数据库事务和锁
3. 业务兼容性
4. 测试覆盖
等待全部完成后,按严重级别汇总。

注意:Subagents 会消耗更多 token,应当用于复杂任务,而不是简单文件修改。

4. 高质量使用技巧

4.1 用 AGENTS.md 固化项目规则

Codex 会读取项目中的 AGENTS.md 作为工作指令。对于长期维护的业务系统,建议把以下内容写进去:

# 项目工作规则

## 技术栈
- 后端:PHP/.NET/Delphi 服务按现有模块边界维护。
- 数据库:MSSQL/MySQL,禁止无确认的大表结构变更。

## 修改原则
- 默认小步修改,不做无关重构。
- 涉及计费、销账、客户状态、余额、套餐变更时,必须说明数据一致性风险。
- SQL 必须使用参数化查询。
- 修改后优先运行相关单元测试或最小可复现脚本。

## 输出要求
- 先列出改动摘要。
- 再列出验证方式。
- 如果没有运行测试,必须说明原因。

4.2 先让 Codex 建模,再让它改

对复杂老系统,不要一上来就说“帮我优化”。更好的顺序:

  1. 让 Codex 画出模块地图。
  2. 让 Codex 找到最小改动点。
  3. 让 Codex 提出风险清单。
  4. 允许它实施单个明确变更。
  5. 再让 Codex 做 review。

4.3 提示词中明确“边界”

好提示:

只修改登录验证码相关逻辑,不改数据库结构,不引入新框架。
如果需要改公共函数,先说明影响范围。

差提示:

优化一下登录。

4.4 把数据库风险写进任务

你有 MSSQL/MySQL 背景,可以让 Codex 按 DBA 思维审查:

请从数据库工程角度 review 这次改动:
- 是否可能引起锁升级、死锁或慢查询
- 是否缺少索引
- 是否影响历史数据兼容
- 是否需要迁移脚本和回滚脚本

4.5 使用“探索 -> 计划 -> 执行 -> 验证”闭环

推荐模板:

先探索相关代码,不要修改。
然后给出一个最小修改计划。
我确认后再改。
改完运行测试,并给出验证结果。

在 Codex Desktop/当前 Codex 环境中,如果你希望它直接做事,也可以省略确认步骤,让它自动完成探索、修改和验证。

5. Codex 插件是什么

OpenAI 官方插件文档说明:Plugins 是 Codex 中可安装、可分发的扩展单元,可以打包:

  1. Skills:可复用工作流说明。
  2. Apps:连接 GitHub、Slack、Google Drive 等外部工具。
  3. MCP servers:给 Codex 提供额外工具或上下文。
  4. Hooks:生命周期钩子,用于启动前加载上下文、做检查等。

插件和 Skills 的关系:

概念作用
Skill一个具体工作流的说明书,例如“生成 PPT”、“审查 PR”、“调试前端 UI”
Plugin安装/分发单位,可以包含多个 skills、MCP server、App 连接和 hooks
MCP server提供工具能力,例如 GitHub 操作、浏览器控制、数据库查询
App/Connector连接第三方 SaaS 或平台账号

6. Codex 插件使用量最多的列表:事实与推荐

6.1 重要说明

截至 2026-05-23,OpenAI 官方文档没有公开“Codex 插件全球安装量/调用量排行榜”。因此不能严谨地说某个 Codex plugin 是“全球使用量第一”。下面采用两个口径:

  1. 公开榜单口径:MCP.Directory 按 GitHub stars、installs、views 排列 MCP server。这个更接近公开可验证数据,但它是 MCP server 榜单,不等同于 Codex 插件安装量。
  2. 实战高频口径:结合 OpenAI 官方示例、当前 Codex 插件体系、软件工程工作流和本机可用插件整理的推荐列表。

6.2 公开数据中排名靠前的 MCP server

MCP.Directory 的排行榜页面标注其 Top 100 MCP servers 按 GitHub stars 排名,并显示 installs 和 views。榜单靠前的项目包括:

排名参考名称主要用途适合 Codex 的场景
1Markitdown文件/文档转 Markdown把 Word、PDF、Office 文档转成 Codex 易读上下文
2Firecrawl网页抓取和结构化提取抓取官网、文档、自媒体文章并整理
3Sequential Thinking分步推理复杂方案分析、迁移计划、架构拆解
4Knowledge Graph Memory记忆和知识图谱长期项目知识、客户系统业务规则沉淀
5Filesystem受控访问本地文件读取指定目录资料、整理文档、批处理
7Context7最新开发文档获取框架/API 最新文档,减少过时答案
8Playwright Browser Automation浏览器自动化前端 UI 验证、截图、交互测试
9/10Chrome DevToolsChrome 调试性能、DOM、Console、网络请求分析
11GitHubIssues、PR、代码搜索PR review、Issue triage、发布流程
16Serena代码语义索引/智能编辑大型代码库理解和定位
20Figma Context设计稿上下文从 Figma 到前端实现

6.3 Codex 实战中最值得优先安装/启用的插件或集成

以下不是官方使用量排名,而是面向软件工程生产力的优先级列表。

1. GitHub 插件

功能

  • 读取 PR、Issue、评论、review thread。
  • 获取 diff、文件 patch、CI 状态和 GitHub Actions 日志。
  • 创建 issue、评论、打标签、请求 review、合并 PR。
  • 将本地改动推送并创建 draft PR。

典型用法

使用 GitHub 插件查看 openai/codex 仓库最近的 PR,并总结有哪些和 MCP 相关。
读取当前 PR 的 unresolved review comments,按优先级修复可操作的问题。

适合你

KDOBSS 这类长期系统如果进入 GitHub/GitLab 流程,GitHub 插件可以让 Codex 做“开发助理 + 代码审查员 + CI 分析员”。

2. Browser / Chrome 插件

功能

  • 打开本地或远程网页。
  • 点击、输入、截图。
  • 检查前端渲染、布局、交互。
  • 使用真实浏览器上下文,适合需要登录态或插件的场景。

典型用法

打开 http://localhost:3000,检查客户详情页在 1366x768 和手机宽度下是否有重叠。
用 Chrome 打开已经登录的后台系统,复现客户套餐变更流程,并记录页面错误。

Browser 与 Chrome 区别

插件适合
BrowserCodex 内置浏览器、本地开发页面、自动化测试
Chrome需要用户真实 Chrome 登录态、扩展、已有标签页

3. Build Web Apps 插件

功能

  • 从零构建前端应用、管理后台、仪表盘、小游戏、工具类页面。
  • 处理 React/Next.js、shadcn、前端测试、视觉 QA。
  • 提供 Stripe、Supabase、React 性能等专项最佳实践。

典型用法

用 Build Web Apps 插件做一个宽带客户运营支撑系统的客户画像仪表盘原型,要求能筛选小区、套餐、欠费状态。
检查这个 React 管理后台的移动端布局,修复按钮文字溢出和表格横向滚动问题。

适合你

如果要为 KDOBSS 做新一代 Web 管理台、AI 客服工作台、运营分析大屏,这个插件非常实用。

4. OpenAI Developers 插件

功能

  • 查询 OpenAI 官方开发文档。
  • 构建 OpenAI API、Agents SDK、ChatGPT Apps SDK 应用。
  • 处理 OpenAI API key 配置、模型选择、API 报错排查。
  • 构建能调用工具和 MCP 的智能客服/agent。

典型用法

使用 OpenAI Developers 插件,根据官方文档设计一个 AI 客服 agent,支持查询客户余额、套餐、故障工单。
检查当前 OpenAI API 调用失败原因,不要泄露 API key,只判断是额度、权限、模型还是网络问题。

适合你

你已经自研 AI 智能客服,这个插件适合把“客服问答”升级成“可调用工具、可查业务系统、可执行流程”的 agent 架构。

5. Spreadsheets 插件

功能

  • 创建/修改/分析 Excel、CSV、TSV。
  • 生成公式、图表、数据透视类报告。
  • 做预算、实际、客户增长、欠费、投诉等分析。

典型用法

分析这个欠费客户 CSV,按小区、套餐、欠费天数分组,生成 Excel 报表和图表。

6. Documents 插件

功能

  • 创建、编辑、渲染、检查 Word 文档。
  • 适合制度、方案、需求、验收、合同草稿。

典型用法

根据这份 Markdown 生成一份 Word 版《AI 客服接入 KDOBSS 技术方案》,包含目录、表格和风险清单。

7. Presentations 插件

功能

  • 创建 PowerPoint/PPTX。
  • 将技术方案、产品路线、汇报材料转成演示文稿。

典型用法

把 AI 客服升级方案整理成 12 页 PPT,面向公司管理层,突出投入产出和落地计划。

8. OpenAI Docs MCP / Context7

功能

  • 搜索和读取最新官方开发文档。
  • 减少模型凭旧知识写过时 API。

安装示例

OpenAI Codex 官方 MCP 文档给出的 Context7 示例:

codex mcp add context7 -- npx -y @upstash/context7-mcp

典型用法

使用 Context7 查询 Next.js 最新 App Router 文档,然后修复当前项目的路由问题。

9. Playwright / Chrome DevTools MCP

功能

  • 控制浏览器、截图、检查 DOM、调试控制台错误。
  • 适合前端自动化验收。

典型用法

用 Playwright MCP 打开本地管理后台,完成登录、客户查询、套餐变更流程,并截图证明。

10. Figma 插件/MCP

功能

  • 读取 Figma 设计上下文。
  • 辅助从设计稿生成前端。

典型用法

读取 Figma 中的客户详情页设计稿,实现到当前 React 项目,保持布局、间距、色彩一致。

11. Slack / Gmail / Google Drive 插件

OpenAI 插件文档把 Gmail、Google Drive、Slack 作为插件示例。

功能

  • Gmail:读取邮件、总结未读、草拟回复。
  • Google Drive:读取 Docs、Sheets、Slides 文件,整理资料。
  • Slack:总结频道、整理线程、草拟回复、生成任务。

典型用法

使用 Slack 插件总结今天和“故障工单”相关的线程,整理成待办列表。
使用 Google Drive 插件读取本周运营会议材料,提取和客户流失相关的数据点。

7. MCP:Codex 常用扩展机制

7.1 MCP 是什么

MCP 全称 Model Context Protocol,是一个开放协议,用于让 LLM 应用以标准方式连接外部数据源和工具。MCP 官方规范把参与方分成:

角色含义
Host承载 LLM 的应用,例如 Codex、Claude Desktop、IDE
ClientHost 内部连接某个 server 的适配层
Server提供工具、资源、提示词的服务

MCP server 可以暴露三类能力:

能力说明示例
Tools让模型执行动作查询 GitHub issue、运行浏览器、查数据库
Resources提供上下文数据文件内容、数据库记录、API 响应
Prompts可复用模板代码审查模板、发布检查模板

客户端还可能提供 Sampling、Roots、Elicitation 等能力,用于模型调用、访问边界和交互式补充信息。

7.2 Codex 支持哪些 MCP 连接

OpenAI Codex MCP 官方文档说明,Codex CLI 和 IDE extension 都支持 MCP,并支持:

  1. STDIO servers:本地进程方式启动。
  2. Streamable HTTP servers:通过 URL 访问。
  3. 环境变量。
  4. Bearer token 认证。
  5. OAuth 认证,可用 codex mcp login <server-name>

7.3 Codex MCP 配置位置

默认位置:

~/.codex/config.toml

项目级配置:

.codex/config.toml

项目级 MCP 配置只应在 trusted project 中使用。

CLI 和 IDE extension 共享这份配置,所以配置一次即可在两个客户端中使用。

7.4 用 CLI 添加 MCP server

通用格式:

codex mcp add <server-name> --env VAR1=VALUE1 --env VAR2=VALUE2 -- <stdio server-command>

示例:

codex mcp add context7 -- npx -y @upstash/context7-mcp

查看帮助:

codex mcp --help

在 Codex TUI 中查看当前 MCP:

/mcp

7.5 手工配置 config.toml

STDIO 示例:

[mcp_servers.context7]
command = "npx"
args = ["-y", "@upstash/context7-mcp"]
env_vars = ["LOCAL_TOKEN"]

[mcp_servers.context7.env]
MY_ENV_VAR = "MY_ENV_VALUE"

HTTP 示例:

[mcp_servers.figma]
url = "https://mcp.figma.com/mcp"
bearer_token_env_var = "FIGMA_OAUTH_TOKEN"
http_headers = { "X-Figma-Region" = "us-east-1" }

工具审批策略示例:

[mcp_servers.chrome_devtools]
url = "http://localhost:3000/mcp"
enabled_tools = ["open", "screenshot"]
default_tools_approval_mode = "prompt"
startup_timeout_sec = 20
tool_timeout_sec = 45
enabled = true

[mcp_servers.chrome_devtools.tools.open]
approval_mode = "approve"

7.6 常用 MCP server 分类

开发文档

MCP用途
OpenAI Docs MCP搜索/读取 OpenAI 官方开发文档
Context7查询最新框架和库文档
AWS Documentation查询 AWS 文档

代码仓库与协作

MCP用途
GitHubPR、Issue、代码搜索、评论
GitLabMerge Request、Issue、自托管 GitLab
Git本地 Git 仓库操作

浏览器与前端

MCP用途
Playwright自动化浏览器、截图、测试
Chrome DevToolsDOM、Console、Network、性能调试
Browser Use更高层浏览器自动化

数据库

MCP用途
PostgreSQL查询/分析 PostgreSQL
SQLite本地轻量数据库
MySQL/MSSQL 社区 MCP连接业务库,需要强权限控制

对生产数据库,不建议给 Codex 直接写权限。更好的做法是:

  1. 只读账号。
  2. 限制 schema。
  3. 禁止执行 DDL/DML。
  4. 用视图或只读 API 暴露必要数据。
  5. 所有 SQL 输出先 review,再由人执行。

文件与知识库

MCP用途
Filesystem受控访问文件目录
Markitdown文档转 Markdown
Knowledge Graph Memory长期知识沉淀
Google Drive团队文档、表格、Slides

设计与产品

MCP用途
Figma设计稿读取、前端实现
Linear/Jira需求、任务、缺陷跟踪
Notion产品文档、知识库

监控与运维

MCP用途
Sentry错误日志、堆栈、release
Grafana/Prometheus 社区 MCP监控指标
Docker/Kubernetes 社区 MCP环境和容器操作

运维类 MCP 权限要谨慎,默认只读,任何重启、删除、扩容、变更配置都应人工审批。

8. 插件开发概要

OpenAI 官方 Build plugins 文档说明,一个 Codex 插件至少需要:

my-plugin/
  .codex-plugin/
    plugin.json

最小 plugin.json

{
  "name": "my-first-plugin",
  "version": "1.0.0",
  "description": "Reusable greeting workflow",
  "skills": "./skills/"
}

更完整的插件可以包含:

my-plugin/
  .codex-plugin/
    plugin.json
  skills/
    my-skill/
      SKILL.md
  hooks/
    hooks.json
  .app.json
  .mcp.json
  assets/

插件可以通过 manifest 指向:

字段作用
skills技能目录
mcpServersMCP server 配置文件
appsapp/connector 映射
hooks生命周期钩子
interface插件展示名、描述、图标、分类、默认提示

8.1 为 KDOBSS 定制插件的建议

可以做一个内部插件:kdobss-ops

建议包含:

kdobss-ops/
  .codex-plugin/
    plugin.json
  skills/
    customer-support-triage/
      SKILL.md
    billing-risk-review/
      SKILL.md
    sql-performance-review/
      SKILL.md
    release-checklist/
      SKILL.md
  .mcp.json
  assets/

Skill 示例:

Skill用途
customer-support-triage根据客户问题判断是账号、套餐、故障、欠费还是设备问题
billing-risk-review审查计费相关代码改动的数据一致性风险
sql-performance-review审查 SQL、索引、锁、慢查询风险
release-checklist发布前检查配置、回滚、SQL、测试、监控

9. 面向 KDOBSS/AI 客服的推荐 Codex 架构

9.1 本地开发组合

Codex CLI
+ AGENTS.md
+ GitHub 插件
+ Browser/Chrome 插件
+ Context7/OpenAI Docs MCP
+ 自定义 KDOBSS Skills

用途:

  • 代码理解。
  • Bug 修复。
  • SQL 审查。
  • 前端页面验证。
  • PR review。

9.2 AI 客服开发组合

OpenAI Developers 插件
+ Agents SDK / Responses API
+ KDOBSS 只读业务 API
+ 工单系统 MCP/API
+ 知识库检索
+ 审计日志

建议原则:

  1. AI 客服不要直接连生产数据库写数据。
  2. 客户余额、套餐、故障、工单状态通过受控 API 查询。
  3. 涉及退费、改套餐、停复机等动作必须走审批或二次确认。
  4. 所有 AI 操作写审计日志。
  5. Codex 负责开发和审查,线上 agent 负责受控执行业务能力。

9.3 运维/数据分析组合

Spreadsheets 插件
+ Documents 插件
+ Presentations 插件
+ 只读数据库导出
+ Markitdown/File MCP

用途:

  • 欠费客户分析。
  • 小区运营报表。
  • 投诉趋势分析。
  • 管理层汇报 PPT。
  • 技术方案和上线文档。

10. 安全与权限建议

MCP 官方规范特别强调,MCP 会带来强大的数据访问和代码执行能力,因此必须重视用户授权、数据隐私、工具安全和采样控制。

建议:

  1. 本地文件 MCP 只开放必要目录。
  2. 数据库 MCP 默认只读。
  3. GitHub 插件写操作前要审批。
  4. 浏览器/Chrome 插件访问敏感后台时,不让 Codex 读取无关隐私页面。
  5. MCP server 从可信来源安装,并定期更新。
  6. 对自建 MCP server 做命令白名单。
  7. 不把生产密钥写入 AGENTS.md 或仓库。
  8. .codex/config.toml 中 token 使用环境变量引用。
  9. 对插件 hooks 保持谨慎,安装后先审查再信任。
  10. 生产运维动作保留人工确认。

11. 推荐日常工作流

11.1 老系统定位问题

阅读当前项目,定位客户余额计算逻辑。
不要修改代码。
输出:
1. 相关文件
2. 数据表/字段
3. 关键函数
4. 可能的异常路径
5. 下一步最小验证方法

11.2 修复 Bug

根据上面的定位,修复余额为负时套餐续费失败的问题。
限制:
- 不改表结构
- 不影响已有正常续费流程
- 补充或更新最小测试
完成后说明验证结果。

11.3 审查 SQL

审查本次改动中的 SQL:
- 是否参数化
- 是否会全表扫描
- 是否缺索引
- 是否有事务边界问题
- 是否影响 MSSQL/MySQL 兼容性

11.4 生成业务文档

根据当前代码和 README,生成《客户套餐变更流程说明.md》。
要求:
- 面向客服主管和开发人员
- 包含流程图
- 标出容易出错的状态
- 不编造代码中不存在的规则

11.5 做发布前检查

作为发布经理,检查当前分支是否可以上线:
- 数据库变更
- 配置项
- 回滚方案
- 测试情况
- 监控和日志
- 影响客户范围
输出上线风险表。

12. 资料来源

OpenAI 官方

MCP 官方与目录

公开社区/媒体参考

13. 最后建议

如果你把 Codex 用在 KDOBSS 这类 20 年演进的大型业务系统里,最有价值的不是“让它一次性重写系统”,而是让它成为长期工程助手:

  1. 读懂历史代码。
  2. 快速定位问题。
  3. 做小步、安全、可回滚的修改。
  4. 按 DBA/架构师视角审查风险。
  5. 自动整理文档、报表、发布清单。
  6. 把重复经验沉淀成 AGENTS.md、Skills 和内部插件。

对你这种已经有深厚工程经验的人,最佳分工是:你负责业务判断、架构边界和最终拍板,Codex 负责搜索、阅读、试错、整理、执行和复核。这样最稳,也最能放大你的经验。

扫码加入猫哥的AI群
最后修改:2026 年 05 月 23 日
点赞的人是最酷的