周深度: Claude Code 的真实前线,是五个 agent 在睡觉,不是一个 agent 在醒着
过去两周 Claude Code 的故事,关键不是模型变聪明了。是用户不再问一个 Claude Code 干一件难事,而是同时让五个 Claude Code 各干一件中等的事。
Karpathy 三月就把这事点名了。他说 AI 研究的下一跳不是更牛的研究员,是 SETI@home 那种成千上万个分布式 loop 同时啃并行假设。这周 HOOTi 那条推文只不过是把 Claude Code 圈子里酝酿了一个月的论点变成了公开版本——真正的 autoresearch 需要分布式算力、并行假设循环、和一套不被某家 API 厂商攥住的贡献层。这是官方版本。非官方版本更有意思也更具体。
18 岁中国学生生日收到 Vision Pro。发了段 29 秒视频,卧室里六个悬浮屏,Claude Code 在改 globals.css。西方推特吃下了"中国小孩干硅谷不愿意干的事"这个剧本,一夜 40 万浏览。然后有人慢放到第 18 秒,扒了背景里另外五个浮窗——不是浏览器,不是文档,是一个钱包面板:gabagool22,利润 86 万美金,28620 笔 BTC 仓位,全是 15 分钟窗口,全是绿的。五个 Claude Code agent 并行,各盯一个 15 分钟 K 线,做亚洲赔率和西方赔率的时间差套利。一个人在睡觉,五个 agent 在醒着。改网站只是封皮。
这才是 Claude Code 这季度真正去的地方。不是"agent 变聪明了"。是很多 agent 并行,每一个钻一个小而清晰的决策窗口。
四月初 YC 的 Garry Tan 发过他的 Minions 队列。一个意思。他写一个小任务清单,同时开 N 个 Claude Code 实例去跑,回来一个个验收。聪明的不是 prompt,是他愿意花 N 倍的 token 换 N 倍吞吐。token 已经替代工程师时间成为新的瓶颈,看懂这件事的人都在悄悄跑自己的 SETI@home。
上周 Barret_China 发了个 coordinator 模式的实战记录——一个调度 agent,十个 worker agent,调度的大部分 token 花在判断哪个 worker 接哪片活儿。同样的形状。再往前一周 smaxor 测 Opus 4.6 的回归套件——烧大量 token 做 A/B 检验哪个模型版本真能 fix 那个 bug。同样的形状。Karpathy 那个 309 美元的国际象棋实验?他把账单全晒了——700 次实验跑出 1 个能 work 的配置。同样的形状。
把这些串起来对当下 AI 主流叙事是个反讽。2025 年底主流框架是说下一站是更强的单体——Opus 5 或者 GPT-6——能想得更深更长。真正的下一站正好相反。五个 Sonnet 4.6 并行跑赢一个 Opus 5 在真实工作流里,因为人类等级的任务更适合分解,不是更适合递归。你不需要一个更聪明的 agent。你需要很多个差不多够用的 agent,每个干一片,由谁——人或者另一个 agent——做合并。
这也解释了这周 user voice 那个又响又齐的吐槽。所有人都在抱怨 Pro 套餐 token 比预期烧得快得多。meruru_aiotaku 做 LP 一半切到 20x 套餐,从此盯着剩余额度"无时无刻"。straylight2021 怀疑 Claude 在悄悄涨价,因为每周观察到聊天 % 消耗一直在涨。0xalisonlamp 在公开纠结要不要续 Pro。Hem_chandiran 切到 Codex 的真实理由就是 Claude Code 上限叠加 GPT-5.5 的更紧 quota。没有人是在抱怨模型质量。他们抱怨的是续航。
为什么所有人都在撞额度?因为他们在跑并行。他们不是和 Claude Code 进行一次对话。他们在排队三件、五件、十件任务。每一层结构——调度 agent、MCP context 服务、Graphify 那种知识图谱——都吃 token。产品是多 agent 拓扑,拓扑天生就是 token 怪兽。Claude Code Pro 当年是按一个对话设计的。人现在跑的是架构。
有一个干净的检验标准能筛出这季度哪些 AI demo 是真,哪些是戏:用户有没有明着烧 token、晒账单、聊每 token 经济学、提自己跑了一晚上跑了多久?如果有,demo 是真的,因为 token 账单是 agentic 工作发生的唯一诚实信号。如果 demo 就是一张一 prompt 截图,那是戏。22 岁的中国博士生用十部 iPhone 接十个 Claude 账号搞社交账号农场作为体育套利 Claude agent 的掩护——真的,因为 token 烧得是真的,并行结构是真的。某条"我用 AI 总结了我的邮件"推文——戏,因为 token 账单就是一 prompt。
今天那两个非工程师的 case 表面看起来不一样,骨架却是一回事。日本税理士一个人扛 60 家客户账,跑的不是更聪明的 Claude——是 14 个规则技能,每个都是一个小 Claude Code 任务,只把判不出的科目升级给 AI 推理。SaaS 财务负责人月结从 8 天压到 3 天,没写出更聪明的 prompt——她把 Financial Data Extractor 固化成可复用的技能,然后在每个月底任务上并行盖章。B2B 销售用 /mtg-prep 把谈判量翻 3-5 倍?同一形状——把同一个 Claude Code 技能并行盖在很多场会议上。
这意味着任何在 Claude Code 上做产品的人,现在该看清三件事。
第一,竞争单位是拓扑,不是 prompt。今天值得关注的创业公司是悄悄出多 agent 编排的——Lindy、Composio、Wonderful、Decagon、Mercor、Factory、Cursor 命令面板——不是营销"最好的 prompt"那批。如果你还在死磕单个 prompt,你已经输给那个并行跑十遍更差 prompt 的人了。
第二,真正的护城河是你切小任务的能力。Garry Tan 的 Minions 能 work,是因为 Garry 会切活儿。日本税理士能 work,是因为他知道 14 个关键词怎么分 60 家客户的科目。jjjkkkunb666 的 BTC 套利能 work,是因为 15 分钟 K 线是个干净的原子决策。规律:并行 agent 只在你的领域天然可分解的时候才 work。所有事都缠在一起的领域——原创战略、创意写作、临床诊断——拿不到加速。找你工作里能放进 15 分钟 K 线的那部分。
第三,预期 Claude Pro 价格会重设。这周的 token cap 抱怨不是模型质量问题,是 plan 续航问题,而续航恰好是用户走向并行之后会指数膨胀的。Anthropic 要么推个透明的 burn rate 计量,要么眼看最重度的用户——也就是产品反馈最重要的那批人——切去任何 token 性价比更高的对手。这波切 Codex 一部分就是这样。一个季度内大概会出现 Pro-Plus 或 Pro-Pro 套餐,定价对并行场景更友好。
这周真正的标题,半年前读起来会很不一样的那个,不是"Claude Code 变聪明了",也不是"Claude Code 干非编码任务"。是这一句:Claude Code 最有意思的那批用户,已经不再像聊天机器人那样用它,而是像 CPU 调度器那样用它。一旦你看见这件事,你就不再问 Claude Code 能做什么,你开始问能同时跑几个。
← 返回所有文章
Karpathy 三月就把这事点名了。他说 AI 研究的下一跳不是更牛的研究员,是 SETI@home 那种成千上万个分布式 loop 同时啃并行假设。这周 HOOTi 那条推文只不过是把 Claude Code 圈子里酝酿了一个月的论点变成了公开版本——真正的 autoresearch 需要分布式算力、并行假设循环、和一套不被某家 API 厂商攥住的贡献层。这是官方版本。非官方版本更有意思也更具体。
18 岁中国学生生日收到 Vision Pro。发了段 29 秒视频,卧室里六个悬浮屏,Claude Code 在改 globals.css。西方推特吃下了"中国小孩干硅谷不愿意干的事"这个剧本,一夜 40 万浏览。然后有人慢放到第 18 秒,扒了背景里另外五个浮窗——不是浏览器,不是文档,是一个钱包面板:gabagool22,利润 86 万美金,28620 笔 BTC 仓位,全是 15 分钟窗口,全是绿的。五个 Claude Code agent 并行,各盯一个 15 分钟 K 线,做亚洲赔率和西方赔率的时间差套利。一个人在睡觉,五个 agent 在醒着。改网站只是封皮。
这才是 Claude Code 这季度真正去的地方。不是"agent 变聪明了"。是很多 agent 并行,每一个钻一个小而清晰的决策窗口。
四月初 YC 的 Garry Tan 发过他的 Minions 队列。一个意思。他写一个小任务清单,同时开 N 个 Claude Code 实例去跑,回来一个个验收。聪明的不是 prompt,是他愿意花 N 倍的 token 换 N 倍吞吐。token 已经替代工程师时间成为新的瓶颈,看懂这件事的人都在悄悄跑自己的 SETI@home。
上周 Barret_China 发了个 coordinator 模式的实战记录——一个调度 agent,十个 worker agent,调度的大部分 token 花在判断哪个 worker 接哪片活儿。同样的形状。再往前一周 smaxor 测 Opus 4.6 的回归套件——烧大量 token 做 A/B 检验哪个模型版本真能 fix 那个 bug。同样的形状。Karpathy 那个 309 美元的国际象棋实验?他把账单全晒了——700 次实验跑出 1 个能 work 的配置。同样的形状。
把这些串起来对当下 AI 主流叙事是个反讽。2025 年底主流框架是说下一站是更强的单体——Opus 5 或者 GPT-6——能想得更深更长。真正的下一站正好相反。五个 Sonnet 4.6 并行跑赢一个 Opus 5 在真实工作流里,因为人类等级的任务更适合分解,不是更适合递归。你不需要一个更聪明的 agent。你需要很多个差不多够用的 agent,每个干一片,由谁——人或者另一个 agent——做合并。
这也解释了这周 user voice 那个又响又齐的吐槽。所有人都在抱怨 Pro 套餐 token 比预期烧得快得多。meruru_aiotaku 做 LP 一半切到 20x 套餐,从此盯着剩余额度"无时无刻"。straylight2021 怀疑 Claude 在悄悄涨价,因为每周观察到聊天 % 消耗一直在涨。0xalisonlamp 在公开纠结要不要续 Pro。Hem_chandiran 切到 Codex 的真实理由就是 Claude Code 上限叠加 GPT-5.5 的更紧 quota。没有人是在抱怨模型质量。他们抱怨的是续航。
为什么所有人都在撞额度?因为他们在跑并行。他们不是和 Claude Code 进行一次对话。他们在排队三件、五件、十件任务。每一层结构——调度 agent、MCP context 服务、Graphify 那种知识图谱——都吃 token。产品是多 agent 拓扑,拓扑天生就是 token 怪兽。Claude Code Pro 当年是按一个对话设计的。人现在跑的是架构。
有一个干净的检验标准能筛出这季度哪些 AI demo 是真,哪些是戏:用户有没有明着烧 token、晒账单、聊每 token 经济学、提自己跑了一晚上跑了多久?如果有,demo 是真的,因为 token 账单是 agentic 工作发生的唯一诚实信号。如果 demo 就是一张一 prompt 截图,那是戏。22 岁的中国博士生用十部 iPhone 接十个 Claude 账号搞社交账号农场作为体育套利 Claude agent 的掩护——真的,因为 token 烧得是真的,并行结构是真的。某条"我用 AI 总结了我的邮件"推文——戏,因为 token 账单就是一 prompt。
今天那两个非工程师的 case 表面看起来不一样,骨架却是一回事。日本税理士一个人扛 60 家客户账,跑的不是更聪明的 Claude——是 14 个规则技能,每个都是一个小 Claude Code 任务,只把判不出的科目升级给 AI 推理。SaaS 财务负责人月结从 8 天压到 3 天,没写出更聪明的 prompt——她把 Financial Data Extractor 固化成可复用的技能,然后在每个月底任务上并行盖章。B2B 销售用 /mtg-prep 把谈判量翻 3-5 倍?同一形状——把同一个 Claude Code 技能并行盖在很多场会议上。
这意味着任何在 Claude Code 上做产品的人,现在该看清三件事。
第一,竞争单位是拓扑,不是 prompt。今天值得关注的创业公司是悄悄出多 agent 编排的——Lindy、Composio、Wonderful、Decagon、Mercor、Factory、Cursor 命令面板——不是营销"最好的 prompt"那批。如果你还在死磕单个 prompt,你已经输给那个并行跑十遍更差 prompt 的人了。
第二,真正的护城河是你切小任务的能力。Garry Tan 的 Minions 能 work,是因为 Garry 会切活儿。日本税理士能 work,是因为他知道 14 个关键词怎么分 60 家客户的科目。jjjkkkunb666 的 BTC 套利能 work,是因为 15 分钟 K 线是个干净的原子决策。规律:并行 agent 只在你的领域天然可分解的时候才 work。所有事都缠在一起的领域——原创战略、创意写作、临床诊断——拿不到加速。找你工作里能放进 15 分钟 K 线的那部分。
第三,预期 Claude Pro 价格会重设。这周的 token cap 抱怨不是模型质量问题,是 plan 续航问题,而续航恰好是用户走向并行之后会指数膨胀的。Anthropic 要么推个透明的 burn rate 计量,要么眼看最重度的用户——也就是产品反馈最重要的那批人——切去任何 token 性价比更高的对手。这波切 Codex 一部分就是这样。一个季度内大概会出现 Pro-Plus 或 Pro-Pro 套餐,定价对并行场景更友好。
这周真正的标题,半年前读起来会很不一样的那个,不是"Claude Code 变聪明了",也不是"Claude Code 干非编码任务"。是这一句:Claude Code 最有意思的那批用户,已经不再像聊天机器人那样用它,而是像 CPU 调度器那样用它。一旦你看见这件事,你就不再问 Claude Code 能做什么,你开始问能同时跑几个。
评论