Microsoft · OpenAI

Technical briefing

Codex介绍与应用场景

从全球模型生态、Microsoft Foundry 与 Azure OpenAI，到 Codex CLI / App 的工程落地方式。

Global LLM Foundry Models Azure OpenAI Codex CLI / App Demos Scenarios

全球 LLM 的介绍 · 海外与国内主流模型

主流模型生态：海外旗舰推理与国内产业模型并行发展

Overseas海外主流模型

OpenAIGPT-5.5 / GPT-5.4 / imag-2

复杂推理、工具调用、代码、多模态和企业 API 生态。

AnthropicClaude Opus / Sonnet

长上下文、文本写作、代码辅助和企业知识工作流。

GoogleGemini 3.1 Pro / Flash

多模态、搜索生态、速度和成本分层产品化。

Open ecosystemMeta Llama、Mistral、xAI Grok

开放权重、低延迟模型和面向不同云/本地部署的选择。

China国内主流模型

Tencent腾讯混元

面向中文、多模态、产业应用和腾讯生态集成的基础模型能力。

Alibaba / Doubao通义千问 Qwen、豆包

开源与商业模型并行，覆盖代码、数学、多语言和多模态。

DeepSeek / Moonshot / MiniMAXDeepSeek V4、Kimi、MiniMAX

推理、代码、长上下文和高性价比 API 是主要竞争点。

Zhipu / Baidu智谱 GLM、文心一言

企业私有化、行业方案、知识库和中文业务场景覆盖。

选型建议 企业选型应按任务类型、中文质量、工具调用、上下文长度、延迟、成本、合规和部署区域组合模型。

Microsoft Foundry Models

Foundry 用一个目录汇聚企业可选模型，并按能力、来源和推理任务筛选

Azure Direct Models统一模型目录

覆盖 OpenAI、Anthropic Claude、DeepSeek、xAI、Meta、Mistral AI、Cohere、Black Forest Labs、Microsoft MAI 等模型生态。

Reasoning推理与代码

GPT、o 系列、DeepSeek、Grok 等用于分析、代码和任务拆解。

Multimodal多模态和图像

gpt-image-2、FLUX、MAI-Image、语音和视觉模型支撑内容生产。

Azure OpenAI Models

Azure OpenAI 覆盖文本、推理、代码、多模态、图像、音频和嵌入模型

Frontier reasoningGPT-5.5 / GPT-5.4 / GPT-5

支持 Responses、Chat Completions、结构化输出、文本与图像处理、函数与工具调用。

Codex modelsgpt-5.3-codex / codex-mini

面向仓库理解、代码生成、测试修复、多文件改动和工程代理任务。

Realtime audiogpt-realtime-2 / gpt-audio-1.5

支持实时语音处理、语音输入输出、语音转写、翻译和 TTS 场景。

Image and videogpt-image-2 / Sora

从自然语言生成图像或视频，适合创意、营销、设计和内容生产链路。

Embeddingstext-embedding 系列

把文本转成向量，用于语义搜索、RAG、相似度、推荐和知识库检索。

Enterprise controlDeployment / Region / Quota

通过部署名、区域、配额、生命周期和监控治理生产调用。

Codex介绍 · Positioning

Codex：把自然语言需求推进到可验证的软件交付

Coding agent 不是代码补全，而是工程任务执行代理

Codex 会读取仓库上下文、遵守项目约定，按目标修改代码、运行命令和测试，并用证据说明结果。

Goal Context Constraints Done when

Context读懂工程现场

代码、README、测试、配置、日志、AGENTS.md 和历史约定。

Plan先调查再行动

复杂任务先定位边界、识别风险，再拆成可验证的小步。

Change执行多步改动

跨文件开发、Bug 修复、脚本生成、依赖调整和局部重构。

Verify把验证做进流程

运行测试、构建、浏览器截图、接口检查和失败复现。

更适合 Codex 的任务表达 明确目标、相关上下文、工程约束和验收标准；让它先调查，再修改，最后交付验证证据。

Codex CLI

Codex CLI 适合 terminal-first 的本地仓库工程任务

$ codex “帮我修复这个测试失败，并解释原因”

CLI 的优势是靠近代码、测试和命令，适合工程师快速迭代。

read files → edit patch → run tests → explain diff

01仓库内直接工作

读取项目文件、执行测试、调用脚本，并把结果留在当前工作区。

02明确任务最快

修 bug、补测试、改 API、生成脚本和处理命令行验证。

03适合工程师日常

在 terminal-first 工作流里保持低切换成本。

Codex App

Codex App 更适合可视化协作、长任务和多工具工作台

Files代码和上下文

仓库文件、测试、文档和变更记录。

Browser可视化验证

打开本地页面、截图检查、确认交互状态。

Local previewScreenshot QAInteraction check

Terminal命令执行

安装依赖、跑测试、启动服务和部署验证。

Artifacts交付物

演示文稿、文档、表格、图片和可浏览页面。

Codex介绍 · Workflow

建议把 Codex 当作“能验证的工程同事”，而不是聊天机器人

01读上下文

README、测试、路由、部署脚本和现有风格。

02锁定行为

用测试或可复现步骤明确交付边界。

03小步修改

按文件边界和现有模式改动，避免无关重构。

04运行验证

测试、构建、截图、curl 和部署检查进入闭环。

Codex介绍 · Governance

企业使用 Codex 的关键是把能力放进可控工程边界

Instructions项目约定

仓库说明、AGENTS 指南、技能和计划文件沉淀团队规范。

Permissions权限边界

按任务配置文件、网络、命令和审批策略，避免越权操作。

Review人工审阅

重要改动进入 PR、代码审查、测试报告和部署审批流程。

Traceability过程可追踪

保留测试输出、变更摘要、失败原因和验证证据。

微软 OpenAI 接入 Codex

接入方式：在 Codex 的 config.toml 中声明 Azure OpenAI Provider

~/.codex/config.toml

model = "gpt-5.5"  # Replace with your actual Azure model deployment name
model_provider = "azure"
model_reasoning_effort = "medium"

[model_providers.azure]
name = "Azure OpenAI"
base_url = "https://YOUR_RESOURCE_NAME.openai.azure.com/openai/v1"
env_key = "AZURE_OPENAI_API_KEY"
wire_api = "responses"

1 · Deploy 先在 Azure OpenAI 部署模型

用企业已有的资源、区域、配额、内容安全和监控策略承载模型；model 填 Azure OpenAI 的 deployment name。

2 · Configure 把 Provider 写进 Codex 配置

在 ~/.codex/config.toml 中配置 base_url、wire_api 和读取密钥的环境变量。

3 · Operate 密钥和治理留在企业侧

本地只放环境变量名；审批、日志、限额、模型版本和降级策略仍由 Azure OpenAI 与工程流水线管理。

Codex 应用场景 · 工程交付

场景一：把需求直接推进到可测试代码

Feature新功能开发

从路由、组件、API、测试到本地验证，按现有代码风格交付。

Bugfix故障定位与修复

复现失败、读日志、补回归测试，再实现最小修复。

Modernization升级与迁移

处理 SDK、模型版本、配置文件、IaC 和部署脚本的联动改造。

Codex 应用场景 · 企业平台

场景二：把企业 AI 平台规范变成可复用工程资产

Template标准应用模板

生成 Azure OpenAI、AI Search、身份、日志和安全默认配置。

Policy平台治理

检查密钥使用、网络暴露、RBAC、模型路由和内容安全策略。

Enablement团队赋能

把最佳实践写成脚手架、检查脚本、示例应用和交付文档。

Codex 应用场景 · 企业与游戏研发

场景三：服务游戏研发、运维、运营和全球化交付

游戏研发玩法原型、服务端接口、数据脚本、自动化测试和性能排查。

游戏运维告警脚本、Runbook、事故复盘、演示控制台和部署验证。

全球化运营多语言素材流程、内容安全接入、运营报表和活动工具。

Codex Demo 1 · 从 0 生成平台

从空目录生成 Codex GameOps Arena：完整可运行的游戏运维运营沙盒

Prompt focus 从 0 创建 TypeScript 全栈项目

React + Vite 前端、Node.js + Express 后端、SQLite 本地数据、seed 脚本、API、测试和 README 一次成型。

Operations console运营后台

Dashboard、玩家查询、区服状态、活动管理、道具发放、充值分析。

Real backend真实 API 与数据库

500 玩家、10 区服、行为日志、订单、活动和发放流水来自 SQLite。

Acceptance可运行可验证

npm install、npm run seed、npm run dev、npm test。

展示重点 Codex 能把自然语言需求拆成工程结构、数据模型、API 路由、前端页面、业务校验和测试闭环。

Codex Demo 2 · 活动生成与配置校验

在 Demo 1 基础上新增 AI 活动设计工作台：从运营需求生成可执行配置

Prompt focus 7 天新服冲榜活动

把自然语言活动规则转成 new-server-ranking.json，包含资格、积分、排名、奖励、预算、冲突和结算规则。

Config配置生成

每日登录、PVP、副本、充值积分上限、Top 100 奖励和预算上限。

ValidatoreventValidator

校验时间、冲突、预算、排名边界、幂等、刷分风险和时区问题。

Workbench可视化预览

左侧需求、中间 JSON、右侧风险，下方奖励表和模拟 Top 10 排行榜。

展示重点 Codex 不只是写页面，还能把运营规则工程化，并用测试覆盖超预算、冲突、幂等和边界漏洞。

Codex Demo 3 · 线上事故排障与修复

先布置可复现事故现场，再让 Codex 像值班工程师一样定位 root cause 并修复

Demo 3A准备事故现场

新增 simulateIncident.ts、incident-001.log、事故 API 和事故中心页面，留下重复发奖、失败发奖和登录延迟线索。

Demo 3B正式排障修复

读取日志、运行失败测试、分析 root cause，最小修复奖励幂等、结算重试和排行榜查询性能。

Evidence验证与复盘

补回归测试、增加监控指标，并生成 incident-001-postmortem.md 作为客户可读复盘。

duplicate_reward_prevented_count reward_idempotency_hit_count settlement_retry_count login_latency_p95_ms