Microsoft · OpenAI

Technical briefing

Codex介绍与应用场景

从全球模型生态、Microsoft Foundry 与 Azure OpenAI,到 Codex CLI / App 的工程落地方式。

Global LLM Foundry Models Azure OpenAI Codex CLI / App Scenarios

全球 LLM 的介绍 · 全球主流 LLM 与 Leaderboard

全球主流模型正在围绕推理、多模态、速度和成本形成分层竞争

LMArena Text Arena · 2026-05-28
  1. Claude Opus 4.6 Thinking1502±4 · Anthropic
  2. Claude Opus 4.7 Thinking1500±5 · Anthropic
  3. Claude Opus 4.61498±4 · Anthropic
  4. Gemini 3.1 Pro Preview1487±4 · Google
  5. GPT-5.5 High1482±6 · OpenAI
OpenAIGPT-5.5 / GPT-5.4 / o3

长上下文、推理、工具调用、多模态和企业 API 生态。

AnthropicClaude Opus / Sonnet

文本任务、人类偏好榜单和长上下文工作流领先。

GoogleGemini 3.1 Pro / Flash

多模态、速度和成本分层明显,适合大规模产品集成。

China / Open weightDeepSeek、Qwen、Kimi、GLM

开源或开放权重模型提升了成本、私有化和区域部署选择。

Artificial Analysis 视角 按 Intelligence Index、价格、速度、延迟综合比较;当前榜首包含 Claude Opus 4.8、GPT-5.5、Claude Opus 4.7、Gemini 3.1 Pro,开放权重代表包含 Kimi K2.6、MiMo、DeepSeek V4 Pro。

Microsoft Foundry Models

Foundry 提供的是“多模型目录 + 企业部署 + 评估治理”的模型平台

Azure Direct Models由 Azure 托管、计费和支持

覆盖 OpenAI、Anthropic Claude、DeepSeek、xAI、Meta、Mistral AI、Cohere、Black Forest Labs、Microsoft MAI 等模型生态。

ReasoningGPT-5.5、o3、DeepSeek V4、Grok

适合复杂分析、代码、科学推理和长任务拆解。

MultimodalGPT-4o、Llama 4、Mistral Large 3

文本、图像输入和跨语言任务,适合产品内多模态体验。

Imagegpt-image-2、FLUX、MAI-Image-2

面向营销素材、图像编辑、产品图和创意生产。

SpecializedCohere Rerank、Embeddings、Document AI

用于 RAG、搜索重排、向量检索和文档理解。

Azure OpenAI Models

Azure OpenAI 覆盖文本、推理、代码、多模态、图像、音频和嵌入模型

Frontier reasoningGPT-5.5 / GPT-5.4 / GPT-5

支持 Responses、Chat Completions、结构化输出、文本与图像处理、函数与工具调用。

Reasoning serieso3 / o4-mini / codex-mini

面向复杂问题求解、代码任务和多步骤推理,适合工程与分析工作流。

Realtime audiogpt-realtime-2 / gpt-audio-1.5

支持实时语音处理、语音输入输出、语音转写、翻译和 TTS 场景。

Image and videogpt-image-2 / Sora

从自然语言生成图像或视频,适合创意、营销、设计和内容生产链路。

Embeddingstext-embedding 系列

把文本转成向量,用于语义搜索、RAG、相似度、推荐和知识库检索。

Enterprise controlDeployment / Region / Quota

通过部署名、区域、配额、生命周期和监控治理生产调用。

Codex介绍 · Positioning

Codex 是面向软件工程工作的 AI 编码代理

Understand理解仓库

读取代码、文档、测试和约定,先建立上下文再动手。

Change执行改动

修改代码、补测试、运行命令、检查失败并继续迭代。

Verify验证结果

把测试、构建、截图、日志和部署结果作为交付证据。

Collaborate协作交付

在 CLI、App、IDE、浏览器和云端任务之间承接不同工作方式。

Codex CLI

Codex CLI 适合 terminal-first 的本地仓库工程任务

Developer loop在仓库里直接工作

读取项目文件、执行测试、调用脚本、修改代码,并把结果留在当前工作区。

Best fit适合明确任务

修 bug、补测试、改 API、重构局部模块、生成脚本和处理命令行验证。

$ codex “帮我修复这个测试失败,并解释原因”

CLI 的优势是靠近代码、测试和命令,适合工程师快速迭代。

Codex App

Codex App 更适合可视化协作、长任务和多工具工作台

Desktop workspace代码、终端、浏览器同屏

适合做前端验证、文档交付、截图检查和复杂任务编排。

Background threads并行推进多个任务

可以把代码审查、资料整理、部署验证拆成多个线程分别执行。

Artifacts交付物更直观

适合生成演示文稿、文档、表格、图像和可浏览的本地页面。

Codex介绍 · Workflow

建议把 Codex 当作“能验证的工程同事”,而不是聊天机器人

1读上下文

先看 README、测试、路由、部署脚本和现有风格。

2写测试

用失败测试锁定行为,避免只靠自然语言描述需求。

3小步修改

按文件边界和现有模式改动,避免无关重构。

4运行验证

测试、构建、浏览器截图、curl 和部署检查都可以进入闭环。

Codex介绍 · Governance

企业使用 Codex 的关键是把能力放进可控工程边界

Instructions项目约定

用仓库说明、AGENTS 指南、技能和计划文件沉淀团队规范。

Permissions权限边界

按任务配置文件、网络、命令和审批策略,避免越权操作。

Review人工审阅

重要改动进入 PR、代码审查、测试报告和部署审批流程。

Traceability过程可追踪

保留测试输出、变更摘要、失败原因和验证证据。

微软 OpenAI 接入 Codex

接入思路:用 Azure OpenAI 承载业务模型,用 Codex 承载工程交付

代码仓库
App · API · IaC · Tests
Codex
读代码 · 改代码 · 跑验证
Azure OpenAI
业务模型部署 · API · 监控
交付结果
代码 · 配置 · 文档 · 部署
落地边界Codex 不直接替代生产审批;它帮助团队把 Azure OpenAI 的调用、密钥、路由、评估和降级策略写进工程系统。

Codex 应用场景 · 工程交付

场景一:把需求直接推进到可测试代码

Feature新功能开发

从路由、组件、API、测试到本地验证,按现有代码风格交付。

Bugfix故障定位与修复

复现失败、读日志、补回归测试,再实现最小修复。

Modernization升级与迁移

处理 SDK、模型版本、配置文件、IaC 和部署脚本的联动改造。

Codex 应用场景 · 企业平台

场景二:把企业 AI 平台规范变成可复用工程资产

Template标准应用模板

生成 Azure OpenAI、AI Search、身份、日志和安全默认配置。

Policy平台治理

检查密钥使用、网络暴露、RBAC、模型路由和内容安全策略。

Enablement团队赋能

把最佳实践写成脚手架、检查脚本、示例应用和交付文档。

Codex 应用场景 · 企业与游戏研发

场景三:服务游戏研发、运维、运营和全球化交付

游戏研发玩法原型、服务端接口、数据脚本、自动化测试和性能排查。
游戏运维告警脚本、Runbook、事故复盘、演示控制台和部署验证。
全球化运营多语言素材流程、内容安全接入、运营报表和活动工具。
← → 翻页 · F 全屏 · O 总览