2026年5月25日super-user

超级用户日报: 2026年5月25日

5月23日这天，所有人晒出来的东西里有两条主线。第一，agent不再是写代码的工具，而成了你可以整件事甩给它、当成一个组合来管、还能用手机随时查岗的同事——有人是看电闸面板的电工，有人是写晶体学代码的科学家，有韩国交易员让一整个"投资委员会"的agent在他睡觉时开会。第二，账单到了。微软砍掉内部Claude Code授权、Uber四个月烧光全年AI预算、连OpenClaw作者自己一个月都烧了130万美元token，全挤在同一天爆出来；而当天最实用的技能不是写提示词，是控成本——砍插件、把流量转到更便宜的模型、查清楚token到底花在哪了。下面是这天把它用得最有意思的一批人。

@aakashgupta [Claude Code]

Claude Code#1

https://x.com/aakashgupta/status/2058216140523163886

一位CPO用一句Claude Code提示词搭出了产品经理agent：它拉取所有GitHub issue、逐条按优先级打分、每天生成一份"接下来该做什么"的报告，全程一条命令做好埋点，连IDE都没打开。最妙的是她加的自我改进循环——agent给自己的打分准确率打分，发现自己一直把bug排得太低，然后在她睡觉时通过cron把修正喂回给自己。她的比喻是纳达尔靠研究自己的比赛录像每天进步1%。产品经理的工作从"处理信息"塌缩成了"定义品味"，即界定什么叫"好"，剩下让agent去消化每一条issue、每一通Gong电话、每一条Slack。结果就是当天交付：issue进来，原型出来，下午就部署。

@Morett_the_best [Claude Code]

https://x.com/Morett_the_best/status/2058170249229324619

这是当天最完整的生产级工作流：在Monest，超过80%的代码现在由Claude生成，而且跑在一条真正的流水线上，不是凭感觉。每个功能先写成RFC、经两位技术主管批准，再通过git submodule铺进前后端仓库，并作为Linear工单的依据，所以CLAUDE.md永远能从RFC和issue两头拿到上下文。一个skill挂在无限反馈循环里读CodeRabbit的review评论、自动应用合理的修复。真正的功课在护栏：PR上限500行（因为内部数据显示超过500行的PR评论数少4倍、根本没人读完）、必须rabbit加人工双批准、16个e2e测试分片。他的结论又狠又对——瓶颈不是生成代码，而是让人类还能真正看懂到底交付了什么。

@v81093933 [OpenClaw]

OpenClaw#3

https://x.com/v81093933/status/2058129233969381559

一位韩国投资者把炒股建议系统搭成了一张agent组织架构图：韩国市场交给OpenClaw agent，美国市场交给Hermes agent，Codex做最终协调。每个都以"团队制"运行，下挂多个辅助agent分别做行情、信息收集、个股分析，然后开一场"投资委员会"会议、综合给出对他持仓的建议。第一版输出太普通，他就把国际局势、债券利率变动、中美美债抛售、油价、做空报告、散户情绪都灌进去，明确调成专挖低估标的、而不是盲目追热点。最终下单还是他自己来，但研究委员会自己转。

@RealYDT [Claude Code]

Claude Code#4

https://x.com/RealYDT/status/2058026908336701825

他照着别人用Codex的样子，让Claude Code帮他优化网络，它就直接跑起了诊断：ping测试、DNS解析时间、MTU检测。它发现10%丢包、一个境外域名走了弯路，然后揪出真正的bug——他网卡IPv4的MTU设的是1500，但PPPoE拨号要占8字节，所以超过1492的包被静默丢弃，而IPv6那边是正确的1492，IPv4一直错着不知道多久了。一行netsh命令下去，丢包归零。他的总结很到位：AI并不是提前知道他网络有问题，它是现场跑命令、看输出、推断原因，和人排查的逻辑一模一样，只是它不嫌烦。

@walls_jason1 [Claude Code]

Claude Code#5

https://x.com/walls_jason1/status/2058240168855752812

一位持证电工正在Vertex上跑生产级推理，用Gemini Vision读住户的电闸面板，工具是他自己用Claude Code搭的。他原话点透了意义：和前沿实验室同款的基础设施，落到了一个靠拉电线吃饭的人手里。这条推文一句话就讲完了这天真正的故事——能力已经扩散到远超软件圈的人群里。

@gagarot200 [Claude Code]

Claude Code#6

https://x.com/gagarot200/status/2058107764942287062

有人在一台原装1998年iMac G3上跑起了Hermes Agent加Claude Code，32MB内存、Mac OS 8，零现代升级。他们把Karpathy的llama2.c移植到经典Mac OS、用Retro68编译、用Python脚本把模型数据转成PowerPC芯片用的大端格式，最后在一台233MHz、大多数人当电子垃圾的机器上让260K参数的模型本地生成了文本。这是个炫技，但它恰恰说明"能跑agent"的门槛已经低到什么程度。

@dadbodshuffl [OpenClaw]

OpenClaw#7

https://x.com/dadbodshuffl/status/2058122167506886686

他用Sarvam给印度本地语言搭了个OpenClaw式agent：一条古吉拉特语、印地语或英语的语音备忘录，经Saarika语音转文字、Saaras翻译，进本地运行时，再通过Playwright驱动已登录的Blinkit浏览器会话、且只在明确批准后才更新购物车。他的设计哲学值得抄走——别让LLM干所有事，让运行时处理确定性的状态、审批、浏览器动作和语言一致性，agent只在需要时兜底。回复也通过Sarvam translate保持在用户的语言。这才是给非英语、非技术用户做的agent交互该有的样子。

@regent0x_ [Claude Code]

Claude Code#8

https://x.com/regent0x_/status/2058079320405332047

当天关于成本最干净的一课，用代际对比讲出来：父亲当年靠一台1986年的Macintosh Plus加一台打印机、零配置撑起了一家200万美元的公司，而儿子的Claude Code在敲第一个提示词之前就烧掉了62000个token、占满上下文窗口的31%，全被闲置的23个插件、8个skill、5个MCP server吃掉。会话30分钟就死、输出随上下文填满越来越差。他跑了/context看清损耗，把全部删掉，只用内置功能加/compact、/clear、/resume，开销降到6000 token。同样的活，会话从30分钟拉到3小时以上。他的金句：大多数插件不过是markdown文件，你自己在.claude/commands里就能写，零开销。

@eeuoss [Claude Code]

Claude Code#9

https://x.com/eeuoss/status/2058249221690863884

他在试Claude Code能把一个图形渲染器从零搭到什么程度，纯Metal4、一套基础材质系统、除ABSL工具外不用任何库。让它跑得起来的关键细节是：他给了agent一个把输出渲染成图片的通道，这样它能自己看结果、自己判断，需要纹理时还会自己去取。这就是把"自我验证循环"用在了一个真正硬核、无法蒙混的底层领域。

@masahirochaen [Claude Code]

Claude Code#10

https://x.com/masahirochaen/status/2058003129585860683

一个极简却高杠杆的技巧：在任何Claude Code请求结尾加一句"做E2E测试"，它就会自己跑验证循环——写完、切出截图或视频帧、用自己的眼睛看、把不对的地方修好，再报告完成。不需要特别的MCP，因为Claude Code本身就能执行命令、也能"看"自己产出的图片。他说这对视频剪辑、设计、落地页检查最管用，正是那些"不亲眼看就发现不了问题"的活，比如字幕被切出画面。更深的点是：把核对答案的方法交给AI，而不是听信它那句"做好了"。

@masahirochaen [Claude Code]

Claude Code#11

https://x.com/masahirochaen/status/2058094516255772977

同一个人的另一份证据：他只用Claude Code做出了一整条关于Google I/O的解说视频——标题卡、两列字幕、字幕动画、BGM都接近完美，文字转录和配乐则通过Gemini 3.5 Flash和Lyria 3 Pro的API搞定。他已经把整套流程做成了skill，也就是说视频剪辑彻底自动化了。他还提到CapCut的自动字幕错字太多反而更慢——正是这种真实细节，区分了真在出活的人和空谈的人。

@Money_plus_ai [Claude Code]

Claude Code#12

https://x.com/Money_plus_ai/status/2058178425840439662

有人用Claude Code搭了个找工作系统，投了超过700份定制申请、真的帮他拿到了offer，然后开源了。它几乎自动化了整条漏斗：审阅不同公司的职位页、按每个岗位定制简历、还能自动替你填申请表。仓库自带14种模式（评估、抓取、PDF处理等）、一个用Go写的终端控制台、用Playwright生成ATS优化的PDF简历，以及45+家预配置公司，包括Anthropic、OpenAI、ElevenLabs和Stripe。重点不是demo，是结果——它让一个真人被录用了。

@harjtaggar [OpenClaw]

OpenClaw#13

https://x.com/harjtaggar/status/2058273638332404043

后院出现一条蛇，他没慌，把照片发给自己的OpenClaw，它识别出是无害的地鼠蛇、给了一个当地确认电话、还建议处理掉招来蛇的地鼠。他的措辞才是悄悄重要的部分：他现在每天都有这种小瞬间，让日常生活变得有点神奇。这正是OpenClaw一再验证的非编码、环境助手式用法，而且比大多数开发demo更有说服力。

@MelihKarakelle [Claude Code]

Claude Code#14

https://x.com/MelihKarakelle/status/2058308161417711679

他让Claude Code读硬件设备的代码、写一份用户手册PDF。当它用ASCII艺术代替截图时，他让它根据Arduino代码生成图像，结果它直接坐下来用Python把整段Arduino代码模拟出来、渲染出LCD屏幕、输出了真正的PNG。他的反应很到位：换个人会说"我费这劲干嘛"然后在Illustrator里一像素一像素画——这正是他以前在做的事。agent用"造个模拟器"解决了一个视觉问题，这不是大多数人会想到的用法。

@eternityspring [Claude Code]

Claude Code#15

https://x.com/eternityspring/status/2058106975599403187

写代码他不盯屏幕了，改看灯。他给Claude Code做了个物理状态灯：绿灯常亮是idle，黄灯闪是thinking，红灯闪是在跑工具，技术栈是Claude Code hooks→Node串口桥→Arduino UNO→三色LED。小玩意，但对agent式工作真正改变了什么读得很准——你不再盯着输出，而是在监督一个进程，环境信号比一墙文字好用。

@dcfgod [Claude Code]

Claude Code#16

https://x.com/dcfgod/status/2057992546404769794

他直接用Claude Code做链上分析，它会自己琢磨明白——找RPC、写脚本、往深挖。他让它调查etherfi的token流向、找出谁在卖、再逐个钱包深挖，拿到了真正有用的结论：团队钱包没卖、ETHFI质押只增不减、CEX出入金大致平衡、还有几个早期投资人等到历史低点终于割肉但都没大手笔。他对市场"就是流动性差"的判断，来自一份他根本没动手写的分析。

@xjuntaro [Claude Code]

Claude Code#17

https://x.com/xjuntaro/status/2058122894815924681

他认识的一位经营者在玩AI驱动的"企业roll-up"：收购一个不温不火的会员制生意（协会、共济会之类），那里有个事务员手动管会员名册、收会费、催款、办活动，然后用Stripe和Supabase重建做出会员页面、裁掉文职人手、等利润率上来再卖掉。他的观察很尖锐——这种系统用AI一天就能实现，而厉害到会用Claude Code的工程师，往往太"高级"了，根本没注意到这些不起眼的生意还存在。套利点不是技术，是看见无聊的钱在哪。

@rohit4verse [Claude Code]

Claude Code#18

https://x.com/rohit4verse/status/2058272712653746581

卖点是：营销团队过去要养一整条工资单，现在一个月200美元。一位投过1亿多美元广告的老手，一口气在Claude Code里独自搭出整条漏斗——定位、落地页、引流磁铁、广告、SEO。但他对"代价"很诚实：工程师那条路要把Perplexity、Playwright、Firecrawl外加17个手工训练的skill都接好，才谈得上产出，这是实打实的搭建成本，不是免费午餐。正是这份对前期工作的坦白，让它可信。

@mvanhorn [Claude Code]

OpenClaw#19

https://x.com/mvanhorn/status/2058189714088456687

他做了个跨Claude Code、OpenClaw、Hermes通用的特斯拉skill："解锁车""开狗狗模式"做成一行命令、手机或电脑都能调，一个agent在每个冬天上学日的7:50出门前给车除霜，还有充电成本台账、以及一个能给他发寻呼提醒的超充排队监视器。签名密钥留在他自己的主机上。这是agent伸出终端、走进物理日常的一个干净例子。

@yutosuzuki [Claude Code]

#20

https://x.com/yutosuzuki/status/2058135863436198322

他一直在搭一套60多个文件的SKILLS、RULES、HOOKS，称之为"初始harness"，最近做了把它变成"别人也能用"的功课。两件事：他把60多个文件按用途和类别编成一张信息图（整理完才发现自己其实没完全掌握自己的系统），又做了个分发skill，让接收方能通过Google Drive一键批量下载、最少配置就跑起来。他的洞见值得留着——"可执行的知识"和"作为文档的知识"是两种根本不同的东西，要把skill做到能交付，必须梳理依赖、分离机密、并重新审视自己的架构。

@d01490201 [Claude Code]

Claude Code#21

https://x.com/d01490201/status/2058244269429965130

一位科学家指出，普通程序员根本写不出考虑晶体学和电子束行为的软件，而能做的商业软件要几十万到上百万日元。有了Claude Code，他自己的领域知识直接变成能跑的程序，而且他说真的很有意思。这是被低估的前沿——本来不会去雇程序员的深度领域专家，现在自己就能造出专业的科研工具。

@leafmeta [Claude Code]

Claude Code#22

https://x.com/leafmeta/status/2058033615142068599

他逆向了Claude Code，发现AI判断逻辑只占代码的1.6%，其余98.4%是权限、会话、工具、上下文管理，整套铺在五层结构上，真正的核心是最底下的agent loop——模型调工具、拿结果、再判断的反复循环。他把这和Anthropic去年把"Claude Code SDK"改名为"Claude Agent SDK"联系起来，那是一个宣告：是循环和边界、而不是模型，造就了agent。他的结论是这一整天的元课：只会换模型的人在浪费时间，会设计循环和护栏的人用同一个模型能榨出好几倍的结果。

@Mnilax [Claude Code]

#23

https://x.com/Mnilax/status/2058283663805047224

当所有人都在为"Claude在台上自我提示"欢呼时，他去审了自我提示真正跑在上面的settings.json——125+个键、只有约40个有文档、其中4个他自己用的在文档里根本找不到。他找出18个真正影响账单的设置，包括一个已知的deny规则bug（你配置写的是拦截、二进制却照读不误），还有大多数应用默认通过inference_geo交的10% Opus税。这正是炒作略过的、不起眼但省钱的活，也恰好踩在这天的成本恐慌上。

@svpino [Claude Code]

Claude Code#24

https://x.com/svpino/status/2058167324130398408

他让Claude Code跑在自己的Omarchy系统上、直接改OS配置文件，并感慨配置文件驱动了OS的大部分、而当前模型处理它们真的很在行。他的waybar出了毛病自己查不出原因，Opus查出来并修好了。一个小却说明问题的例子——agent从"写应用"走向了"管机器本身"。

🗣 用户心声

用户心声

这一周的情绪从"能力"猛地转向"经济性"，而且诉求越来越具体。从大家的说法里能听出几条清晰信号：

成本成了头号约束，而非能力。微软砍掉内部Claude Code授权、Uber四个月烧光2026年AI预算，成千上万开发者通过免费代理把Claude Code的流量转到DeepSeek和Kimi、把账单清零。用户想要真正的成本管控和可见性，也在为/usage和能看清各skill花销的网关工具叫好。（@AskYoshik、@rdd147）

插件和上下文膨胀成了新的自伤。多个重度用户各自独立发现，自己精心攒的插件栈在干活之前就吃掉了上下文窗口的30%-40%，而砍回内置功能竟像换了个更强的模型。诉求是更精简、更聪明的默认配置。（@regent0x_、@L1vsun）

结构胜过模型，那就把结构做得更好。当天最响的技术洞见是：harness——循环、权限、上下文管理——才是Claude Code好用的98%，大家想要原生、一等公民级的多agent编排，而不是后期硬接上去。（@leafmeta、@_vmlops）

延迟正在悄悄把人推向Codex。好几个用户说Claude Code的响应时间让他们连问个小问题都犯怵，而一旦迁移成本下降，他们就会走。速度现在是留存问题。（@suna_gaku、@akihiro_genai）

持久、可迁移的记忆仍然没解决好，以至于人们在外挂第三方记忆层，并拿Claude的项目记忆和Codex的AGENTS.md模式做对比。他们要的是能跨会话存活、且归自己所有的记忆。（@CMhOeNnExY）

而在这一切之下，是一股"万物agent原生"的拉力：工具该设计成让agent直接对话、而不是给人点按，以及拒绝被绑死在单一模型供应商上。（@davidyinai）

📡 生态产品雷达

生态产品雷达

Codex：永恒的对照组，并越来越成为"拼速度和收尾那20%"的主力，而Claude Code守着设计和规划。几乎每篇工作流推文都提到。

Hermes Agent：Nous Research的本地优先agent框架，在投资bot、复古硬件、特斯拉skill里都和Claude Code/OpenClaw搭配使用。大家反复去够的那个"开源、跑在自己机器上"的替代品。

Google Antigravity：谷歌的Claude Code式CLI/IDE，讨论极多，包括上手评测说它相比Codex和Cursor令人失望，以及Pichai那个"12小时从零搭操作系统"的演示。

codegraph：预索引的代码知识图谱，把工具调用砍掉70%-94%、探索成本降约35%，兼容Claude Code、Codex、Cursor、opencode、Hermes。当天被提到最多的上下文效率工具。

free-claude-code / 9router：把Claude Code流量转到10-40个免费供应商（DeepSeek、Kimi等）的代理，2万+开发者在用，带自动回退和约40%的token压缩。这场成本起义的中心。

agentmemory / SIBYL：通过MCP接入的持久语义记忆层，主打替代付费记忆API，并给出幻觉和长时程留存的基准数据。

opencode：开源终端agent，GitHub 15.7万+星，自带模型可跨75+供应商，被反复称作"免费版Claude Code"。

Cowork：Anthropic的文档自动化（Word/Excel/PDF），也是撬动非技术职场人采用的楔子。

NotebookLM：和Claude Code/Hermes搭配，把研究外包出去以削减token消耗。

Pi / oh-my-pi：Pi harness生态，被定位成Claude Code/Codex的"Arch vs Ubuntu"式替代，浏览器操作很强。

← 上一篇

cmux 把终端重做了一遍，让 agent 没法从你眼皮底下溜走

Loop 日报: 2026年5月25日

← 返回所有文章

加载中...

超级用户日报: 2026年5月25日

相关文章

评论