Anthropic: Claude 已经在写自己 80% 的代码
Anthropic 研究院给一件大家都怀疑、但没人量化过的事按上了具体数字。截至 2026 年 5 月,合并进 Anthropic 自家生产系统的代码里,超过 80% 是 Claude 写的。而在 2025 年 2 月内部 coding agent 上线之前,这个比例还是个位数。现在那里的工程师每季度产出的代码量,大约是 2021 到 2025 年的 8 倍。
这份报告讲的是递归自我改进,也就是一个 AI 系统能够完全自主地设计并造出自己的下一代。Anthropic 措辞很谨慎:我们还没到那一步,也不是必然会到。但他们认为这一天来得可能比大多数机构准备好的时间要早,而且这次是拿内部数据说话,不是凭感觉。
方法论才是有意思的地方。他们扒了 2026 年 1 月到 3 月真实的 Claude Code 会话,那些研究员和 Claude 一起啃开放性难题的场景,比如搞清楚一次训练为什么老是崩。然后让另一个 Claude 模型来判断,下一步该怎么走,是人给的建议更好,还是 AI 给的更好。结果是 AI 已经在相当一部分判断上赢了。这才是关键。重点不是打字更快,而是谁更知道下一步该干什么。
说句实在的,当造前沿模型的公司亲口告诉你,它自己的研发正在被自己的模型加速,而且把账本摊开给你看,智能爆炸这个话题就不再是思想实验了。原文值得一读:https://www.anthropic.com/institute/recursive-self-improvement
← 返回所有文章
这份报告讲的是递归自我改进,也就是一个 AI 系统能够完全自主地设计并造出自己的下一代。Anthropic 措辞很谨慎:我们还没到那一步,也不是必然会到。但他们认为这一天来得可能比大多数机构准备好的时间要早,而且这次是拿内部数据说话,不是凭感觉。
方法论才是有意思的地方。他们扒了 2026 年 1 月到 3 月真实的 Claude Code 会话,那些研究员和 Claude 一起啃开放性难题的场景,比如搞清楚一次训练为什么老是崩。然后让另一个 Claude 模型来判断,下一步该怎么走,是人给的建议更好,还是 AI 给的更好。结果是 AI 已经在相当一部分判断上赢了。这才是关键。重点不是打字更快,而是谁更知道下一步该干什么。
说句实在的,当造前沿模型的公司亲口告诉你,它自己的研发正在被自己的模型加速,而且把账本摊开给你看,智能爆炸这个话题就不再是思想实验了。原文值得一读:https://www.anthropic.com/institute/recursive-self-improvement
评论