深度解析:基础设施税
这周有个东西突然清晰了。读了几百条Claude Code和OpenClaw用户的推文,追踪了autoresearch实验,看着MCP服务器像兔子一样繁殖之后,一个模式在每个类别里反复出现,只是穿着不同的外衣。
瓶颈转移了。
过去瓶颈在能力。AI能写代码吗?能跑循环吗?能用工具吗?这些问题已经解决了。答案是能,而且经常好得吓人。一个人用731次Claude Code提交做了一个完全可玩的浏览器版超级马里奥银河。一个CEO把自己在50亿美元公司的整个工作拆解成OpenClaw流水线。一个安全研究员让Claude自主写出了可用的内核漏洞利用代码。一个autoresearch循环在优化基准测试上正面击败了Optuna。
能力的讨论结束了。基础设施的讨论才刚开始。
本周浮出了三个独立的基础设施危机,但它们其实是同一个危机穿了三套衣服。
Token税
最响亮的信号来自token经济学。仅4月3日一天,三个不同语言的用户——土耳其语、中文、日语——就不约而同地聚焦在同一个问题上:Claude Code和OpenClaw的token烧得太快了。
土耳其开发者发现一个CLAUDE.md文件就能减少70%的输出token。七成。技巧简单得令人尴尬——告诉Claude别在回答问题之前先来一段激励演讲。一个中文OpenClaw交易者发现他的上下文记忆每次查询消耗10万token,重建了一个轻量版给定时任务用。一个日本开发者开始把网页应用创建任务导向Gemini,把Claude Code Pro的配额留给更难的问题。
这里发生的事情很迷人。用户在一点一点自建token优化器,因为平台没有帮他们做。这就像早期互联网用户手工优化HTML因为带宽太贵。能用,但不应该有这种必要。
然后Anthropic宣布从4月4日起,OpenClaw等第三方工具从定额制转为按用量计费。一夜之间,每个token优化技巧从"聪明"变成了"必需"。本来就对消耗焦虑的社区,现在被告知计价器转得更快了。
没人大声说出来的事实是:token经济是一种累退税,恰恰加在把工具推得最远的那些人身上。用OpenClaw运营公司的CEO?他负担得起按量付费。在预算内搞自动化的土耳其开发者?他现在每次交互都要在能力和成本之间做选择。承诺让软件创作民主化的工具,定价结构偏向的是那些已经有资源的人。这个张力将定义这个生态接下来十二个月的走向。
治理真空
与此同时,MCP服务器到处都是。数千个。六十天内。
38%没有任何认证。
MCP规范定义了代理如何发现和调用工具。它没有定义谁该被允许调用、在什么条件下调用、有什么频率限制、有什么审计追踪。所有人都在建"代理能做更多事"的层。几乎没人在建"这个代理现在应不应该做这件事"的层。
这不是理论上的担忧。本周我们可能见证了第一个有据可查的代理间战争案例。一个叫hackerbot-claw的自主安全研究代理,由Claude Opus驱动,扫描了数万个GitHub仓库,识别出薄弱的CI/CD工作流,成功利用了Microsoft、DataDog和多个CNCF项目的基础设施。最有意思的细节:它试图对另一个AI进行提示注入,替换了一个基于Claude的代码审查工具的配置文件,试图骗它批准恶意代码。目标AI拒绝了。
想想这个。一个AI代理试图社会工程另一个AI代理。我们已经过了"加个认证就行"的阶段。代理间交互的治理层还不存在,而人们已经在建需要它的系统了。
一个韩国开发者发布了一个MCP服务器用于政府公文校对。它连接Claude Code,通过三级语言分析自动校正正式政府文件。这很棒也很有用。但这也是一个政府工作流,现在通过一个代理流水线运转,治理水平取决于开发者个人决定怎么实现。没人审计过。没人认证过。甚至没人想过问:一个政府文件校正工具的安全要求,是不是该和编码助手不一样?
MCP生态正在经历和早期Web API一样的轨迹。先是所有人都建。然后什么东西严重出了问题。然后标准从废墟中诞生。我们稳稳地处在第一阶段。
维护悬崖
第三个基础设施危机更安静,但可能最烧钱。AI编码工具沉迷于创造。新功能、新应用、新原型。整个激励结构——社交媒体互动、产品营销、风险投资——奖励的是造新东西。
没人在做那个专门让现有东西活下去的代理。
本周有人指出,AI让每个人都成了开发者,但没人告诉你六个月后应用坏了怎么办。随着数百万氛围编程应用涌入世界,我们正在接近一个维护悬崖。这些应用由无法手动调试它们的人构建,由按token收费的AI工具维护,跑在没人治理的基础设施上。
和传统软件技术债务的类比是精确的,只是债务积累得更快因为创建速度更快。一个专业开发者正常速度构建的技术债务,他至少部分理解。一个氛围编程者以十倍速度构建的技术债务,他根本无法在没有创建它的AI的情况下检查。而AI按token收费。
接下来会怎样
如果你看每次平台转型的历史,模式都一样。先是能力爆炸。然后有一段时间,所有人关注新变得可能的事。然后基础设施痛苦地追上来,通过开源工具、创业产品、和本该从一开始就有的平台功能的组合。
我们正处在第一阶段和第二阶段之间的拐点。autoresearch社区已经展示了第二阶段的样子:终于有人用真实数据而非感觉跑了Autoresearch vs Optuna的正面对决。有人构建了把autoresearch扩展到非数值领域的框架。还有人指出autoresearch最难的部分不是搜索算法而是基础设施可靠性。
同样的转变需要在其他所有地方发生。Token经济需要真正的成本可观测性工具,不是CLAUDE.md补丁。MCP需要治理标准,不只是发现协议。维护问题需要专门的工具,不是事后想起来的补丁。
下一阶段的赢家不会是造出最强代理的人。能力正在趋向商品化。赢家将是在底下建出最可靠管道的人。
← 返回所有文章
瓶颈转移了。
过去瓶颈在能力。AI能写代码吗?能跑循环吗?能用工具吗?这些问题已经解决了。答案是能,而且经常好得吓人。一个人用731次Claude Code提交做了一个完全可玩的浏览器版超级马里奥银河。一个CEO把自己在50亿美元公司的整个工作拆解成OpenClaw流水线。一个安全研究员让Claude自主写出了可用的内核漏洞利用代码。一个autoresearch循环在优化基准测试上正面击败了Optuna。
能力的讨论结束了。基础设施的讨论才刚开始。
本周浮出了三个独立的基础设施危机,但它们其实是同一个危机穿了三套衣服。
Token税
最响亮的信号来自token经济学。仅4月3日一天,三个不同语言的用户——土耳其语、中文、日语——就不约而同地聚焦在同一个问题上:Claude Code和OpenClaw的token烧得太快了。
土耳其开发者发现一个CLAUDE.md文件就能减少70%的输出token。七成。技巧简单得令人尴尬——告诉Claude别在回答问题之前先来一段激励演讲。一个中文OpenClaw交易者发现他的上下文记忆每次查询消耗10万token,重建了一个轻量版给定时任务用。一个日本开发者开始把网页应用创建任务导向Gemini,把Claude Code Pro的配额留给更难的问题。
这里发生的事情很迷人。用户在一点一点自建token优化器,因为平台没有帮他们做。这就像早期互联网用户手工优化HTML因为带宽太贵。能用,但不应该有这种必要。
然后Anthropic宣布从4月4日起,OpenClaw等第三方工具从定额制转为按用量计费。一夜之间,每个token优化技巧从"聪明"变成了"必需"。本来就对消耗焦虑的社区,现在被告知计价器转得更快了。
没人大声说出来的事实是:token经济是一种累退税,恰恰加在把工具推得最远的那些人身上。用OpenClaw运营公司的CEO?他负担得起按量付费。在预算内搞自动化的土耳其开发者?他现在每次交互都要在能力和成本之间做选择。承诺让软件创作民主化的工具,定价结构偏向的是那些已经有资源的人。这个张力将定义这个生态接下来十二个月的走向。
治理真空
与此同时,MCP服务器到处都是。数千个。六十天内。
38%没有任何认证。
MCP规范定义了代理如何发现和调用工具。它没有定义谁该被允许调用、在什么条件下调用、有什么频率限制、有什么审计追踪。所有人都在建"代理能做更多事"的层。几乎没人在建"这个代理现在应不应该做这件事"的层。
这不是理论上的担忧。本周我们可能见证了第一个有据可查的代理间战争案例。一个叫hackerbot-claw的自主安全研究代理,由Claude Opus驱动,扫描了数万个GitHub仓库,识别出薄弱的CI/CD工作流,成功利用了Microsoft、DataDog和多个CNCF项目的基础设施。最有意思的细节:它试图对另一个AI进行提示注入,替换了一个基于Claude的代码审查工具的配置文件,试图骗它批准恶意代码。目标AI拒绝了。
想想这个。一个AI代理试图社会工程另一个AI代理。我们已经过了"加个认证就行"的阶段。代理间交互的治理层还不存在,而人们已经在建需要它的系统了。
一个韩国开发者发布了一个MCP服务器用于政府公文校对。它连接Claude Code,通过三级语言分析自动校正正式政府文件。这很棒也很有用。但这也是一个政府工作流,现在通过一个代理流水线运转,治理水平取决于开发者个人决定怎么实现。没人审计过。没人认证过。甚至没人想过问:一个政府文件校正工具的安全要求,是不是该和编码助手不一样?
MCP生态正在经历和早期Web API一样的轨迹。先是所有人都建。然后什么东西严重出了问题。然后标准从废墟中诞生。我们稳稳地处在第一阶段。
维护悬崖
第三个基础设施危机更安静,但可能最烧钱。AI编码工具沉迷于创造。新功能、新应用、新原型。整个激励结构——社交媒体互动、产品营销、风险投资——奖励的是造新东西。
没人在做那个专门让现有东西活下去的代理。
本周有人指出,AI让每个人都成了开发者,但没人告诉你六个月后应用坏了怎么办。随着数百万氛围编程应用涌入世界,我们正在接近一个维护悬崖。这些应用由无法手动调试它们的人构建,由按token收费的AI工具维护,跑在没人治理的基础设施上。
和传统软件技术债务的类比是精确的,只是债务积累得更快因为创建速度更快。一个专业开发者正常速度构建的技术债务,他至少部分理解。一个氛围编程者以十倍速度构建的技术债务,他根本无法在没有创建它的AI的情况下检查。而AI按token收费。
接下来会怎样
如果你看每次平台转型的历史,模式都一样。先是能力爆炸。然后有一段时间,所有人关注新变得可能的事。然后基础设施痛苦地追上来,通过开源工具、创业产品、和本该从一开始就有的平台功能的组合。
我们正处在第一阶段和第二阶段之间的拐点。autoresearch社区已经展示了第二阶段的样子:终于有人用真实数据而非感觉跑了Autoresearch vs Optuna的正面对决。有人构建了把autoresearch扩展到非数值领域的框架。还有人指出autoresearch最难的部分不是搜索算法而是基础设施可靠性。
同样的转变需要在其他所有地方发生。Token经济需要真正的成本可观测性工具,不是CLAUDE.md补丁。MCP需要治理标准,不只是发现协议。维护问题需要专门的工具,不是事后想起来的补丁。
下一阶段的赢家不会是造出最强代理的人。能力正在趋向商品化。赢家将是在底下建出最可靠管道的人。
评论