2026年5月24日super-user

超级用户日报: 2026年5月25日

5月23日这天,所有人晒出来的东西里有两条主线。第一,agent不再是写代码的工具,而成了你可以整件事甩给它、当成一个组合来管、还能用手机随时查岗的同事——有人是看电闸面板的电工,有人是写晶体学代码的科学家,有韩国交易员让一整个"投资委员会"的agent在他睡觉时开会。第二,账单到了。微软砍掉内部Claude Code授权、Uber四个月烧光全年AI预算、连OpenClaw作者自己一个月都烧了130万美元token,全挤在同一天爆出来;而当天最实用的技能不是写提示词,是控成本——砍插件、把流量转到更便宜的模型、查清楚token到底花在哪了。下面是这天把它用得最有意思的一批人。
@aakashgupta [Claude Code]
Claude Code#1
https://x.com/aakashgupta/status/2058216140523163886
一位CPO用一句Claude Code提示词搭出了产品经理agent:它拉取所有GitHub issue、逐条按优先级打分、每天生成一份"接下来该做什么"的报告,全程一条命令做好埋点,连IDE都没打开。最妙的是她加的自我改进循环——agent给自己的打分准确率打分,发现自己一直把bug排得太低,然后在她睡觉时通过cron把修正喂回给自己。她的比喻是纳达尔靠研究自己的比赛录像每天进步1%。产品经理的工作从"处理信息"塌缩成了"定义品味",即界定什么叫"好",剩下让agent去消化每一条issue、每一通Gong电话、每一条Slack。结果就是当天交付:issue进来,原型出来,下午就部署。
@Morett_the_best [Claude Code]
#2
https://x.com/Morett_the_best/status/2058170249229324619
这是当天最完整的生产级工作流:在Monest,超过80%的代码现在由Claude生成,而且跑在一条真正的流水线上,不是凭感觉。每个功能先写成RFC、经两位技术主管批准,再通过git submodule铺进前后端仓库,并作为Linear工单的依据,所以CLAUDE.md永远能从RFC和issue两头拿到上下文。一个skill挂在无限反馈循环里读CodeRabbit的review评论、自动应用合理的修复。真正的功课在护栏:PR上限500行(因为内部数据显示超过500行的PR评论数少4倍、根本没人读完)、必须rabbit加人工双批准、16个e2e测试分片。他的结论又狠又对——瓶颈不是生成代码,而是让人类还能真正看懂到底交付了什么。
@v81093933 [OpenClaw]
OpenClaw#3
https://x.com/v81093933/status/2058129233969381559
一位韩国投资者把炒股建议系统搭成了一张agent组织架构图:韩国市场交给OpenClaw agent,美国市场交给Hermes agent,Codex做最终协调。每个都以"团队制"运行,下挂多个辅助agent分别做行情、信息收集、个股分析,然后开一场"投资委员会"会议、综合给出对他持仓的建议。第一版输出太普通,他就把国际局势、债券利率变动、中美美债抛售、油价、做空报告、散户情绪都灌进去,明确调成专挖低估标的、而不是盲目追热点。最终下单还是他自己来,但研究委员会自己转。
@RealYDT [Claude Code]
Claude Code#4
https://x.com/RealYDT/status/2058026908336701825
他照着别人用Codex的样子,让Claude Code帮他优化网络,它就直接跑起了诊断:ping测试、DNS解析时间、MTU检测。它发现10%丢包、一个境外域名走了弯路,然后揪出真正的bug——他网卡IPv4的MTU设的是1500,但PPPoE拨号要占8字节,所以超过1492的包被静默丢弃,而IPv6那边是正确的1492,IPv4一直错着不知道多久了。一行netsh命令下去,丢包归零。他的总结很到位:AI并不是提前知道他网络有问题,它是现场跑命令、看输出、推断原因,和人排查的逻辑一模一样,只是它不嫌烦。
@walls_jason1 [Claude Code]
Claude Code#5
https://x.com/walls_jason1/status/2058240168855752812
一位持证电工正在Vertex上跑生产级推理,用Gemini Vision读住户的电闸面板,工具是他自己用Claude Code搭的。他原话点透了意义:和前沿实验室同款的基础设施,落到了一个靠拉电线吃饭的人手里。这条推文一句话就讲完了这天真正的故事——能力已经扩散到远超软件圈的人群里。
@gagarot200 [Claude Code]
Claude Code#6
https://x.com/gagarot200/status/2058107764942287062
有人在一台原装1998年iMac G3上跑起了Hermes Agent加Claude Code,32MB内存、Mac OS 8,零现代升级。他们把Karpathy的llama2.c移植到经典Mac OS、用Retro68编译、用Python脚本把模型数据转成PowerPC芯片用的大端格式,最后在一台233MHz、大多数人当电子垃圾的机器上让260K参数的模型本地生成了文本。这是个炫技,但它恰恰说明"能跑agent"的门槛已经低到什么程度。
@dadbodshuffl [OpenClaw]
OpenClaw#7
https://x.com/dadbodshuffl/status/2058122167506886686
他用Sarvam给印度本地语言搭了个OpenClaw式agent:一条古吉拉特语、印地语或英语的语音备忘录,经Saarika语音转文字、Saaras翻译,进本地运行时,再通过Playwright驱动已登录的Blinkit浏览器会话、且只在明确批准后才更新购物车。他的设计哲学值得抄走——别让LLM干所有事,让运行时处理确定性的状态、审批、浏览器动作和语言一致性,agent只在需要时兜底。回复也通过Sarvam translate保持在用户的语言。这才是给非英语、非技术用户做的agent交互该有的样子。
@regent0x_ [Claude Code]
Claude Code#8
https://x.com/regent0x_/status/2058079320405332047
当天关于成本最干净的一课,用代际对比讲出来:父亲当年靠一台1986年的Macintosh Plus加一台打印机、零配置撑起了一家200万美元的公司,而儿子的Claude Code在敲第一个提示词之前就烧掉了62000个token、占满上下文窗口的31%,全被闲置的23个插件、8个skill、5个MCP server吃掉。会话30分钟就死、输出随上下文填满越来越差。他跑了/context看清损耗,把全部删掉,只用内置功能加/compact、/clear、/resume,开销降到6000 token。同样的活,会话从30分钟拉到3小时以上。他的金句:大多数插件不过是markdown文件,你自己在.claude/commands里就能写,零开销。
@eeuoss [Claude Code]
Claude Code#9
https://x.com/eeuoss/status/2058249221690863884
他在试Claude Code能把一个图形渲染器从零搭到什么程度,纯Metal4、一套基础材质系统、除ABSL工具外不用任何库。让它跑得起来的关键细节是:他给了agent一个把输出渲染成图片的通道,这样它能自己看结果、自己判断,需要纹理时还会自己去取。这就是把"自我验证循环"用在了一个真正硬核、无法蒙混的底层领域。
@masahirochaen [Claude Code]
Claude Code#10
https://x.com/masahirochaen/status/2058003129585860683
一个极简却高杠杆的技巧:在任何Claude Code请求结尾加一句"做E2E测试",它就会自己跑验证循环——写完、切出截图或视频帧、用自己的眼睛看、把不对的地方修好,再报告完成。不需要特别的MCP,因为Claude Code本身就能执行命令、也能"看"自己产出的图片。他说这对视频剪辑、设计、落地页检查最管用,正是那些"不亲眼看就发现不了问题"的活,比如字幕被切出画面。更深的点是:把核对答案的方法交给AI,而不是听信它那句"做好了"。
@masahirochaen [Claude Code]
Claude Code#11
https://x.com/masahirochaen/status/2058094516255772977
同一个人的另一份证据:他只用Claude Code做出了一整条关于Google I/O的解说视频——标题卡、两列字幕、字幕动画、BGM都接近完美,文字转录和配乐则通过Gemini 3.5 Flash和Lyria 3 Pro的API搞定。他已经把整套流程做成了skill,也就是说视频剪辑彻底自动化了。他还提到CapCut的自动字幕错字太多反而更慢——正是这种真实细节,区分了真在出活的人和空谈的人。
@Money_plus_ai [Claude Code]
Claude Code#12
https://x.com/Money_plus_ai/status/2058178425840439662
有人用Claude Code搭了个找工作系统,投了超过700份定制申请、真的帮他拿到了offer,然后开源了。它几乎自动化了整条漏斗:审阅不同公司的职位页、按每个岗位定制简历、还能自动替你填申请表。仓库自带14种模式(评估、抓取、PDF处理等)、一个用Go写的终端控制台、用Playwright生成ATS优化的PDF简历,以及45+家预配置公司,包括Anthropic、OpenAI、ElevenLabs和Stripe。重点不是demo,是结果——它让一个真人被录用了。
@harjtaggar [OpenClaw]
OpenClaw#13
https://x.com/harjtaggar/status/2058273638332404043
后院出现一条蛇,他没慌,把照片发给自己的OpenClaw,它识别出是无害的地鼠蛇、给了一个当地确认电话、还建议处理掉招来蛇的地鼠。他的措辞才是悄悄重要的部分:他现在每天都有这种小瞬间,让日常生活变得有点神奇。这正是OpenClaw一再验证的非编码、环境助手式用法,而且比大多数开发demo更有说服力。
@MelihKarakelle [Claude Code]
Claude Code#14
https://x.com/MelihKarakelle/status/2058308161417711679
他让Claude Code读硬件设备的代码、写一份用户手册PDF。当它用ASCII艺术代替截图时,他让它根据Arduino代码生成图像,结果它直接坐下来用Python把整段Arduino代码模拟出来、渲染出LCD屏幕、输出了真正的PNG。他的反应很到位:换个人会说"我费这劲干嘛"然后在Illustrator里一像素一像素画——这正是他以前在做的事。agent用"造个模拟器"解决了一个视觉问题,这不是大多数人会想到的用法。
@eternityspring [Claude Code]
Claude Code#15
https://x.com/eternityspring/status/2058106975599403187
写代码他不盯屏幕了,改看灯。他给Claude Code做了个物理状态灯:绿灯常亮是idle,黄灯闪是thinking,红灯闪是在跑工具,技术栈是Claude Code hooks→Node串口桥→Arduino UNO→三色LED。小玩意,但对agent式工作真正改变了什么读得很准——你不再盯着输出,而是在监督一个进程,环境信号比一墙文字好用。
@dcfgod [Claude Code]
Claude Code#16
https://x.com/dcfgod/status/2057992546404769794
他直接用Claude Code做链上分析,它会自己琢磨明白——找RPC、写脚本、往深挖。他让它调查etherfi的token流向、找出谁在卖、再逐个钱包深挖,拿到了真正有用的结论:团队钱包没卖、ETHFI质押只增不减、CEX出入金大致平衡、还有几个早期投资人等到历史低点终于割肉但都没大手笔。他对市场"就是流动性差"的判断,来自一份他根本没动手写的分析。
@xjuntaro [Claude Code]
Claude Code#17
https://x.com/xjuntaro/status/2058122894815924681
他认识的一位经营者在玩AI驱动的"企业roll-up":收购一个不温不火的会员制生意(协会、共济会之类),那里有个事务员手动管会员名册、收会费、催款、办活动,然后用Stripe和Supabase重建做出会员页面、裁掉文职人手、等利润率上来再卖掉。他的观察很尖锐——这种系统用AI一天就能实现,而厉害到会用Claude Code的工程师,往往太"高级"了,根本没注意到这些不起眼的生意还存在。套利点不是技术,是看见无聊的钱在哪。
@rohit4verse [Claude Code]
Claude Code#18
https://x.com/rohit4verse/status/2058272712653746581
卖点是:营销团队过去要养一整条工资单,现在一个月200美元。一位投过1亿多美元广告的老手,一口气在Claude Code里独自搭出整条漏斗——定位、落地页、引流磁铁、广告、SEO。但他对"代价"很诚实:工程师那条路要把Perplexity、Playwright、Firecrawl外加17个手工训练的skill都接好,才谈得上产出,这是实打实的搭建成本,不是免费午餐。正是这份对前期工作的坦白,让它可信。
@mvanhorn [Claude Code]
OpenClaw#19
https://x.com/mvanhorn/status/2058189714088456687
他做了个跨Claude Code、OpenClaw、Hermes通用的特斯拉skill:"解锁车""开狗狗模式"做成一行命令、手机或电脑都能调,一个agent在每个冬天上学日的7:50出门前给车除霜,还有充电成本台账、以及一个能给他发寻呼提醒的超充排队监视器。签名密钥留在他自己的主机上。这是agent伸出终端、走进物理日常的一个干净例子。
@yutosuzuki [Claude Code]
#20
https://x.com/yutosuzuki/status/2058135863436198322
他一直在搭一套60多个文件的SKILLS、RULES、HOOKS,称之为"初始harness",最近做了把它变成"别人也能用"的功课。两件事:他把60多个文件按用途和类别编成一张信息图(整理完才发现自己其实没完全掌握自己的系统),又做了个分发skill,让接收方能通过Google Drive一键批量下载、最少配置就跑起来。他的洞见值得留着——"可执行的知识"和"作为文档的知识"是两种根本不同的东西,要把skill做到能交付,必须梳理依赖、分离机密、并重新审视自己的架构。
@d01490201 [Claude Code]
Claude Code#21
https://x.com/d01490201/status/2058244269429965130
一位科学家指出,普通程序员根本写不出考虑晶体学和电子束行为的软件,而能做的商业软件要几十万到上百万日元。有了Claude Code,他自己的领域知识直接变成能跑的程序,而且他说真的很有意思。这是被低估的前沿——本来不会去雇程序员的深度领域专家,现在自己就能造出专业的科研工具。
@leafmeta [Claude Code]
Claude Code#22
https://x.com/leafmeta/status/2058033615142068599
他逆向了Claude Code,发现AI判断逻辑只占代码的1.6%,其余98.4%是权限、会话、工具、上下文管理,整套铺在五层结构上,真正的核心是最底下的agent loop——模型调工具、拿结果、再判断的反复循环。他把这和Anthropic去年把"Claude Code SDK"改名为"Claude Agent SDK"联系起来,那是一个宣告:是循环和边界、而不是模型,造就了agent。他的结论是这一整天的元课:只会换模型的人在浪费时间,会设计循环和护栏的人用同一个模型能榨出好几倍的结果。
@Mnilax [Claude Code]
#23
https://x.com/Mnilax/status/2058283663805047224
当所有人都在为"Claude在台上自我提示"欢呼时,他去审了自我提示真正跑在上面的settings.json——125+个键、只有约40个有文档、其中4个他自己用的在文档里根本找不到。他找出18个真正影响账单的设置,包括一个已知的deny规则bug(你配置写的是拦截、二进制却照读不误),还有大多数应用默认通过inference_geo交的10% Opus税。这正是炒作略过的、不起眼但省钱的活,也恰好踩在这天的成本恐慌上。
@svpino [Claude Code]
Claude Code#24
https://x.com/svpino/status/2058167324130398408
他让Claude Code跑在自己的Omarchy系统上、直接改OS配置文件,并感慨配置文件驱动了OS的大部分、而当前模型处理它们真的很在行。他的waybar出了毛病自己查不出原因,Opus查出来并修好了。一个小却说明问题的例子——agent从"写应用"走向了"管机器本身"。
🗣 用户心声
用户心声

这一周的情绪从"能力"猛地转向"经济性",而且诉求越来越具体。从大家的说法里能听出几条清晰信号:

成本成了头号约束,而非能力。微软砍掉内部Claude Code授权、Uber四个月烧光2026年AI预算,成千上万开发者通过免费代理把Claude Code的流量转到DeepSeek和Kimi、把账单清零。用户想要真正的成本管控和可见性,也在为/usage和能看清各skill花销的网关工具叫好。(@AskYoshik、@rdd147)

插件和上下文膨胀成了新的自伤。多个重度用户各自独立发现,自己精心攒的插件栈在干活之前就吃掉了上下文窗口的30%-40%,而砍回内置功能竟像换了个更强的模型。诉求是更精简、更聪明的默认配置。(@regent0x_、@L1vsun)

结构胜过模型,那就把结构做得更好。当天最响的技术洞见是:harness——循环、权限、上下文管理——才是Claude Code好用的98%,大家想要原生、一等公民级的多agent编排,而不是后期硬接上去。(@leafmeta、@_vmlops)

延迟正在悄悄把人推向Codex。好几个用户说Claude Code的响应时间让他们连问个小问题都犯怵,而一旦迁移成本下降,他们就会走。速度现在是留存问题。(@suna_gaku、@akihiro_genai)

持久、可迁移的记忆仍然没解决好,以至于人们在外挂第三方记忆层,并拿Claude的项目记忆和Codex的AGENTS.md模式做对比。他们要的是能跨会话存活、且归自己所有的记忆。(@CMhOeNnExY)

而在这一切之下,是一股"万物agent原生"的拉力:工具该设计成让agent直接对话、而不是给人点按,以及拒绝被绑死在单一模型供应商上。(@davidyinai)
📡 生态产品雷达
生态产品雷达

Codex:永恒的对照组,并越来越成为"拼速度和收尾那20%"的主力,而Claude Code守着设计和规划。几乎每篇工作流推文都提到。

Hermes Agent:Nous Research的本地优先agent框架,在投资bot、复古硬件、特斯拉skill里都和Claude Code/OpenClaw搭配使用。大家反复去够的那个"开源、跑在自己机器上"的替代品。

Google Antigravity:谷歌的Claude Code式CLI/IDE,讨论极多,包括上手评测说它相比Codex和Cursor令人失望,以及Pichai那个"12小时从零搭操作系统"的演示。

codegraph:预索引的代码知识图谱,把工具调用砍掉70%-94%、探索成本降约35%,兼容Claude Code、Codex、Cursor、opencode、Hermes。当天被提到最多的上下文效率工具。

free-claude-code / 9router:把Claude Code流量转到10-40个免费供应商(DeepSeek、Kimi等)的代理,2万+开发者在用,带自动回退和约40%的token压缩。这场成本起义的中心。

agentmemory / SIBYL:通过MCP接入的持久语义记忆层,主打替代付费记忆API,并给出幻觉和长时程留存的基准数据。

opencode:开源终端agent,GitHub 15.7万+星,自带模型可跨75+供应商,被反复称作"免费版Claude Code"。

Cowork:Anthropic的文档自动化(Word/Excel/PDF),也是撬动非技术职场人采用的楔子。

NotebookLM:和Claude Code/Hermes搭配,把研究外包出去以削减token消耗。

Pi / oh-my-pi:Pi harness生态,被定位成Claude Code/Codex的"Arch vs Ubuntu"式替代,浏览器操作很强。
← 上一篇
cmux 把终端重做了一遍,让 agent 没法从你眼皮底下溜走
下一篇 →
Loop 日报: 2026年5月25日
← 返回所有文章

评论

加载中...
>_