2026年4月15日Agents Coding API

GPT-5.2 首个超越人类专家的模型 — Codex 让它写代码

OpenAI 刚发了 GPT-5.2，这次是真的有料。

核心数据：GPT-5.2 Thinking 是第一个在 GDPval 上达到或超越人类专家水平的模型，在 70.9% 的知识型工作对比中打平或击败行业顶尖专业人士。注意，不是学术 benchmark，不是精心挑选的评测，是真实专业人士每天在做的实际工作。

但对 agent 生态来说，真正的重头戏是 GPT-5.2-Codex。这是 OpenAI 专门做的 agentic coding 模型，针对长周期任务优化。大规模重构、整体代码迁移、跨文件特性构建——之前的模型做到一半就会迷路，Codex 不会。它在 SWE-Bench Pro 和 Terminal-Bench 2.0 上都拿了最高分，而且第一次能在原生 Windows 环境下可靠地写代码。它有 context compaction 功能，长时间编码会话中不会因为上下文窗口而失去连贯性。

视觉能力的升级也值得一提。Codex 现在可以拿设计稿直接转成可运行的原型，在写代码的同时读截图、技术图表和 UI 界面。安全审计能力显著增强——边写代码边审计。

三个模型等级：GPT-5.2 Instant 快速响应，Thinking 深度推理，Pro 全能力。API 立即可用，ChatGPT 付费用户开始推送。

前沿模型和其他选手之间的差距又拉大了。如果你在做写代码的 agent，GPT-5.2-Codex 就是新的天花板。

https://openai.com/index/introducing-gpt-5-2/
https://openai.com/index/introducing-gpt-5-2-codex/

← 上一篇

GitHub 每日之星 — 2026年04月16日

Gemini Robotics-ER 1.6 教机器人读懂真实世界

← 返回所有文章

加载中...

GPT-5.2 首个超越人类专家的模型 — Codex 让它写代码

更多文章

评论