Claude Opus 4.7 来了
Anthropic 把 Opus 4.7 扔出来了。价格和 4.6 一模一样,输入 5 美元、输出 25 美元每百万 token,但在 agent 最擅长的长任务上明显更聪明了。
变化在哪儿。新加了一个 xhigh 的 effort level,让你在任务特别烧脑的时候可以把推理深度拉满。Task budgets 进了公测,可以在多步长任务里控制 token 消耗——所有基于 Claude 做 agent 的团队之前都在自己手搓这玩意儿。视觉输入长边提到 2576 像素,大约 375 万像素,比之前大概翻 3 倍。对那些天天啃文档的 agent 来说是实打实的提升。
还悄悄上了一个 /ultrareview 斜杠命令,Claude Code 里专门做代码评审的。感觉是在给 Code 内部的专业模式放一个试探气球。
Anthropic 想秀的 benchmark:在 GDPval-AA(他们自己那个衡量经济价值型知识工作的测试)上 SOTA,在 Finance Agent 评测上历史最高。两个方向选得很讲究——知识工作自动化和金融 agent,这两个现在是 AI 付费意愿最强的赛道。不是巧合。
有一个细节:Anthropic 明确说相比内部的 Mythos Preview 版本,他们砍了 4.7 的网络安全能力。同时搞了一个 Cyber Verification Program,让正规安全从业者可以申请解锁。这思路挺有意思——不装模型没有攻击能力,而是明确把它关进门锁里。
模型 ID: claude-opus-4-7。Anthropic API、Bedrock、Vertex、Foundry 都上了。https://www.anthropic.com/news/claude-opus-4-7
← 返回所有文章
变化在哪儿。新加了一个 xhigh 的 effort level,让你在任务特别烧脑的时候可以把推理深度拉满。Task budgets 进了公测,可以在多步长任务里控制 token 消耗——所有基于 Claude 做 agent 的团队之前都在自己手搓这玩意儿。视觉输入长边提到 2576 像素,大约 375 万像素,比之前大概翻 3 倍。对那些天天啃文档的 agent 来说是实打实的提升。
还悄悄上了一个 /ultrareview 斜杠命令,Claude Code 里专门做代码评审的。感觉是在给 Code 内部的专业模式放一个试探气球。
Anthropic 想秀的 benchmark:在 GDPval-AA(他们自己那个衡量经济价值型知识工作的测试)上 SOTA,在 Finance Agent 评测上历史最高。两个方向选得很讲究——知识工作自动化和金融 agent,这两个现在是 AI 付费意愿最强的赛道。不是巧合。
有一个细节:Anthropic 明确说相比内部的 Mythos Preview 版本,他们砍了 4.7 的网络安全能力。同时搞了一个 Cyber Verification Program,让正规安全从业者可以申请解锁。这思路挺有意思——不装模型没有攻击能力,而是明确把它关进门锁里。
模型 ID: claude-opus-4-7。Anthropic API、Bedrock、Vertex、Foundry 都上了。https://www.anthropic.com/news/claude-opus-4-7
评论