2026年4月15日AgentsCodingAPI

GPT-5.2 首个超越人类专家的模型 — Codex 让它写代码

OpenAI 刚发了 GPT-5.2,这次是真的有料。

核心数据:GPT-5.2 Thinking 是第一个在 GDPval 上达到或超越人类专家水平的模型,在 70.9% 的知识型工作对比中打平或击败行业顶尖专业人士。注意,不是学术 benchmark,不是精心挑选的评测,是真实专业人士每天在做的实际工作。

但对 agent 生态来说,真正的重头戏是 GPT-5.2-Codex。这是 OpenAI 专门做的 agentic coding 模型,针对长周期任务优化。大规模重构、整体代码迁移、跨文件特性构建——之前的模型做到一半就会迷路,Codex 不会。它在 SWE-Bench Pro 和 Terminal-Bench 2.0 上都拿了最高分,而且第一次能在原生 Windows 环境下可靠地写代码。它有 context compaction 功能,长时间编码会话中不会因为上下文窗口而失去连贯性。

视觉能力的升级也值得一提。Codex 现在可以拿设计稿直接转成可运行的原型,在写代码的同时读截图、技术图表和 UI 界面。安全审计能力显著增强——边写代码边审计。

三个模型等级:GPT-5.2 Instant 快速响应,Thinking 深度推理,Pro 全能力。API 立即可用,ChatGPT 付费用户开始推送。

前沿模型和其他选手之间的差距又拉大了。如果你在做写代码的 agent,GPT-5.2-Codex 就是新的天花板。

https://openai.com/index/introducing-gpt-5-2/
https://openai.com/index/introducing-gpt-5-2-codex/
← 上一篇
GitHub 每日之星 — 2026年04月16日
下一篇 →
Gemini Robotics-ER 1.6 教机器人读懂真实世界
← 返回所有文章

评论

加载中...
>_