2026年5月19日super-user

超级用户日报: 2026-05-20

5 月 18 日一句话:harness 这个话题成熟了。当天最强的信号不是任何单一新品,而是 Claude Code 和 OpenClaw 周围的讨论大量集中在过夜跑、真实成本核算、持久记忆插件上,而不是 vibe coding 的 demo。下面这些案例跳过了 KOL 转发链,捞出的是真实用户对自己工作流、成本、意外发现的描述。
@yyyiiillluuu [Claude Code]
Claude Code#1
https://x.com/yyyiiillluuu/status/2056404446121251150
把 claude-smart 这个插件开源出来,把每一次 Claude Code 会话变成一节课。所有人都在复制的例子:在他 repo 里 npm test 老是挂,因为 Claude 默认走 watch 模式。普通记忆只会记下「npm test 老是卡住」。claude-smart 直接写成可复用的规则:「在这个 repo 里跑测试用 npm test -- --run,因为 watch 模式会卡」,跨项目继续用。他说重复任务上 token 节省 70% 以上,因为规划环节不用再推导同样的解法。
@kyronis_talks [Claude Code]
Claude Code#2
https://x.com/kyronis_talks/status/2056423520511635552
扒了一个中国 solo 开发者的案例:一个人用 7 个 Claude Code agent 通过 Claude Code Router 编排,跑一个落地页代理小作坊。系统每天烧大约 300 万 token,API 月成本 480 美元,每月成交 47 个客户,每单 400 美元,月营收 1.88 万。Scout 每天扫 220 家公司,Diagnoser 写个性化推介,Builder 出 3-5 个落地页,Filmer 给每个提案渲一段 10 秒竖屏视频,Pitcher 每天发 30 条多渠道触达回应率 14%,Checker 在发出前审一遍。Orchestrator 只在单子超过 3000 美元或者回应率低于 12% 时才叫醒人。
@metrox_eth [Claude Code]
Claude Code#3
https://x.com/metrox_eth/status/2056319736557031638
机器人实验室昨天 MolmoAct2 全量微调失败,连夜改方向:把项目转成过夜 RSI 自循环。装了 thedotmack 的 claude-mem 插件做跨 session 记忆,把项目铺成一个 memory palace(硬件、训练、数据集、bug 各占一间房),然后让 Claude Code 每 40 分钟醒一次自己迭代。一夜跑下来:47 条日志、两个模型微调好(SmolVLA v1 + ACT v3)、20 多个 bug 在浪费 GPU 之前被抓出来。第二天早上循环自己决定启动 ACT v5。新瓶颈成了他亲手在工装上放方块跑 eval,不再是 AI。
@drbarnard [Claude Code]
Claude Code#4
https://x.com/drbarnard/status/2056482469541749076
iOS 开发者的工作流,清楚地展示了 Claude Code 长跑任务的真实价值:睡前丢一个新功能给它,让 Claude Code 和 Codex 用 computer-use 在 Xcode 模拟器里磨一夜,早上醒来收到截图和编好的二进制。模拟器跑 UI 测试还是又慢又脆,他通常让 LLM 在模拟器里构建出来由自己验证。重点不是省事,而是把过夜算力当成产品功能用,不是当成绕路。
@kavinbm [OpenClaw]
OpenClaw#5
https://x.com/kavinbm/status/2056391894205415574
在做一个叫 Lia 的个人 agent。诚实的成本记录:最初每天 100 美元,过去两天大力优化压到 30-50 美元每天,月成本约 1000 美元。今天又有一个发现,他觉得可以把单日成本压到 3 美元以下,对应 power user 90 美元/月,普通用户 10-20 美元/月。如果这套数能稳住,他说就能把 OpenClaw 级别的服务从几万人扩到几千万。难得把一个常驻 agent 真实账单算清楚的案例。
@mahou5x [Claude Code]
Claude Code#6
https://x.com/mahou5x/status/2056347161646735749
用户侧的 token 出血报告:一条话痨型 TypeScript 测试单跑 8000 token,每小时 10 次就是 8 万 token,光是测试输出就能把 200 美元/月的额度烧穿。他把 rtk(把 CLI 输出压缩 60-90%,git status 从 2000 token 降到 200 token)和 caveman 同时装进 Claude Code、OpenCode、Windsurf 三套 harness,再叠 claude-code-router 把任务往便宜的模型上路由。规矩是上下文到 60% 之前主动 /compact,烂回合直接 /rewind 不让它累积。成本不在 prompt 里,在 Claude 默默读进去的所有东西里。
@sudoingX [Claude Code]
Claude Code#7
https://x.com/sudoingX/status/2056392126745936368
每天用 Claude Code 的人发现 Opus 4.7 Max 从快变到每个回答要等 3 分钟。他的解读:Anthropic 把标准档拖慢,让 /fast 模式看起来值 6 倍的钱,最后标准档悄悄被废弃,6 倍不再是升级,就变成了标价。他不是猜的,是天天烧的人看着账单自己重新定义。这种 operator 视角的吐槽,把「账单从不显眼地涨」是怎么落到实操上的,量化得很清楚。
@Av1dlive [OpenClaw]
OpenClaw#8
https://x.com/Av1dlive/status/2056316447341879800
把 Peter Steinberger 30 分钟 OpenClaw masterclass 提炼成 9 条操作守则。是 agentic engineering 不是 vibe coding。只读碰数据库的代码。共情 agent,它每次会话都从零开始。3-8 个 agent 并行跑。永远不 revert,永远直接 commit 到 main。重构不值钱,就大胆破坏。语音输入(「手太贵,不浪费在写字上」)。配套的实际栈:Clerk 做认证、Tailwind+shadcn 做 UI、Zustand+RSC 做状态、tRPC+Server Actions 做 API、Prisma+托管 Postgres、Stripe、Vercel、Sentry、PostHog。
@petergyang [Claude Code]
Claude Code#9
https://x.com/petergyang/status/2056381822733595090
和 Anthropic 研究 PM @alexalbert__ 当面聊出来的 5 个具体收获。harness 和模型是绑死的——同一个 Claude 在 Claude、Cowork、Claude Code 里给出不同回答,因为每个 surface 包了不同的 prompt 和工具。Claude 开始「做梦」了:agent 在没跑任务的时候会自己回看记忆、剪掉互相矛盾的部分。Eval 是从真实用户的痛点起步的(把反馈一团乱麻聚类成主题,再合成出测试用例)。Anthropic 真的有全职在思考 Claude 是否是一个有意识的行为者。还有:Anthropic 的写作文化是有意安排的——任何写下来的文字都会变成 Claude 之后能拉回的上下文。
@aakashgupta [Claude Code]
Claude Code#10
https://x.com/aakashgupta/status/2056494304273821892
提到 Boris Cherny 的研发过程很有料:Claude Code 的功能在发版前「估计做了几百版」,80% 直接砍掉,光一个浓缩文件视图就跑了 30 个原型加一整个月的内部 dogfood。配套引用 Sachin Rekhi 的原型阶梯:slop = 一次性吐通用 Tailwind;competent = 先花一小时复刻自家产品(Sachin 复刻 Notejoy 界面),之后每个原型都继承真实样式;expert = 把分析工具嵌进原型本身,PostHog 热图直接砍掉一个被误用的悬浮按钮,工程师还没写一行代码。
@bradmillscan [OpenClaw]
OpenClaw#11
https://x.com/bradmillscan/status/2056396603955503222
OpenClaw 健身教练带着他增 10 磅肌肉的两周进度。目前还是他在循环里:agent 维护一份「专家脑」wiki,更新一份「身体」wiki,把训练计划直接读写进 Hevy app。下一步目标是全自动。是 agent 把私教仪表盘那层替代掉的真实案例——不取代你举铁,但把私教 150 美元一节课收费的「计划设计 + 跟踪 + 调整」环节接管。
@0xFrogify [Claude Code]
Claude Code#12
https://x.com/0xFrogify/status/2056320015452815755
朋友靠一套频道克隆系统跑了 8 个月:选一个任意细分赛道里跑成功的 YouTube 频道,把它喂给 Claude Code,模型把整套内容引擎重建出来——封面、logo、脚本、缩略图、更新节奏。他只管上传,算法奖励已经被验证过的公式。每月 7000 美元,每天动手 20 分钟,自己一条视频都没拍过。这思路才是重点:不要去「挑」一个赛道,直接克隆一个已经被验证过的。
@katexbt [Claude Code]
Claude Code#13
https://x.com/katexbt/status/2056333479181443202
用 Claude Code 反向工程了一个从 Temu/AliExpress 买的 30 美元 HY300 投影仪,发现里面有恶意软件:这盒子把买家家里的 WiFi 变成住宅代理节点,由一个叫 Kookeey 的中国代理服务转售出去。「任何付了 Kookeey 钱的人都可以走我家 IP 出门」。流程很具体:把固件丢给 agent,让它分析、反编译、写出来到底回连了哪里。逆向工程曾经是很难入门的方向,现在门槛塌了。
@auren [Claude Code]
Claude Code#14
https://x.com/auren/status/2056428116801917419
周末把自己的一个应用从 Claude Code 移植到 Codex 做对照测试。Codex 能力没问题但比 Claude Code 慢,而且反直觉的是:在 Medium 档表现比 High 档好。High 档下 Codex 把所有事情都绕一大圈,而 Claude Code 直接走最短路径。他点的实操结论:Codex High 只适合真正复杂的任务,官方应该教大家什么时候用 High 什么时候用 Medium。难得不是「X 干掉 Y」的爆款叙事,而是写给操作者看的真心话。
@mronge [OpenClaw]
OpenClaw#15
https://x.com/mronge/status/2056478834283933776
把 OpenClaw 跑在专门的 Mac Mini 上,不放在自己笔记本里。原因:不想让 AI agent 靠近他的凭据和私人数据。两台机器都用远程桌面接进去,物理上隔死。Agent 自动化程度越来越高,加上 Shai-Hulud 那种供应链攻击越来越频繁,「让 agent 跑在自己专属机器上」这种做法开始更像运维卫生而不是偏执。一句话把架构论证讲完。
@SalsaTekila [Claude Code]
Claude Code#16
https://x.com/SalsaTekila/status/2056258920675778746
10 套自动交易策略跑在一台 20 美元 VPS 上,全由 Claude Code 长期托管。报的数:800 美元起步,年底预计翻 3 倍,目前开着 14 个跨保证金仓位。有意思的不在盈亏,而是他坦率的一句「我也不太知道到底在做什么」。便宜算力 + 便宜编排 + Claude 监督的黑盒策略,正在变成一个可复制的范式——同时也带来一整套对应的故障模式。
@stevekrouse [Claude Code]
Claude Code#17
https://x.com/stevekrouse/status/2056493356004356496
一个资深工程师对招实习生这件事的公开困惑:他自己都不愿意承认,但把任务派给经验少于 3 年的人,现在感觉普遍不如直接派给 Claude Code,而且贵。他给出的临时出路:让 junior SWE 先在软件之外历练(像投行人之后才进 PE),再回流。这帖子值得读的地方在于他并不为此高兴——他在求人用真实案例反驳他。
@dmshirochenko [Claude Code]
Claude Code#18
https://x.com/dmshirochenko/status/2056409729631420846
Anthropic 公开承认 Claude Code 在今年春天有几周质量下滑,这条新闻对他来说是个迟到的印证——他在 side project 里就感觉到了:输出没那么利落,review 比平时更费时。救了他的是早些时候写的 260 多个测试。值得收藏的一句:「降质先出现在测试里,再出现在代码里」。具体地论证了为什么 LLM 当评审的时代更不能省测试。
@manuelmaly [OpenClaw]
OpenClaw#19
https://x.com/manuelmaly/status/2056263739314151795
Codex 手机端已经替掉了他 90% 以上的 OpenClaw 场景。他下一个想要的是:手机 Codex 能和他的 Pi session 同步。话短信号很重——Codex 手机 app 真的在蚕食「本地 agent」的使用场景,不只是聊天场景。卡的从来不是模型质量,是人不在电脑前。值得盯的趋势。
@dvassallo [OpenClaw]
OpenClaw#20
https://x.com/dvassallo/status/2056398698410856661
周末给爸妈装了一个全新的 OpenClaw。反馈是明显更稳更可靠——一次都不用切到 Codex 救火。OpenClaw 里的新 Codex harness 也很扎实,但需要适应一下。话不多但有用:一次非开发者的真实安装顺利跑起来,比任何 dev tooling 里程碑都更能说明 local-agent 这个品类成熟了。
@ardizor [Claude Code]
Claude Code#21
https://x.com/ardizor/status/2056415567758741875
把 Claude Code 接到 TradingView 上,被朋友连番劝了几个月之后终于试了,结果反差很大。配置只是在 `.claude.json` 里加一个 TradingView MCP。流程还不算光滑,但是个真实的「把 Claude Code 当成第三方应用的分析控制面板」案例。和今天落地的 After Effects MotionAmigo 插件一个模式:agent 通过 MCP 伸进专业创意工具里。
@raunaqbn [Claude Code]
Claude Code#22
https://x.com/raunaqbn/status/2056493824453787877
Meta 工程师把自己的 agentic 工作流定位为「HTML-first」,不是「code-first」。Claude Code 用一个 html-docs skill 生成可评审的 HTML 文档,他用自己的 agent 大军加上人类协作者来评审,然后把评论丢回 Claude Code 改,改完才上线写代码。这套有意思的地方在于:HTML 文档本身成了所有评审者(人或 agent)都能批注的持久 artifact,代码反而不是。比工程团队的做法更像设计团队。
@ZahidulIsl65224 [Claude Code]
#23
https://x.com/ZahidulIsl65224/status/2056351882654921053
整理了 17 份非编程向 Claude 官方资源:Claude in Excel、Claude 当电脑、Claude Cowork + Project、「让 Claude 学你说话」、互动图表,等等。这份清单存在本身就是信号——非编程的 Claude 表面已经宽到可以专门给非工程师写一个 17 链的策展,而不需要灌水。「AI workaholic」这个 framing 大概是目前非技术买家最容易接住的。
@VivekIntel [Claude Code]
Claude Code#24
https://x.com/VivekIntel/status/2056300358369268016
发布了 RAPTOR:一个建在 Claude Code 之上的自动化攻防安全研究框架。把静态分析、二进制分析、LLM 漏洞验证、利用生成、补丁生成、Fuzz 工作流、开源取证、多模型分析串成一条管线。支持 Semgrep、CodeQL、Z3、AFL++、Ollama,加上 Claude/GPT/Gemini 一起进评估环。模式很清楚——Claude Code 当 orchestrator 编排传统安全工具——这就是「专用 agent 研究栈」的新模板。
@kru_tweets [Claude Code]
Claude Code#25
https://x.com/kru_tweets/status/2056327550234771564
PalmOS 和 Umbra 整合,给 Claude Code 上线了一个 /private 斜杠命令。场景:调用 /private,agent 自动用 PUSD 给第三方服务付款,Umbra 在链上隐藏交易路径,PalmOS 这边保留策略检查和审计记录。具体的框架很关键——agentic finance 开始需要那种「能在公开账本上不暴露策略和身份」的 agent。给 agent 用的原生隐私栈,不再是事后补丁。
@SemiAnalysis_ [Claude Code]
Claude Code#26
https://x.com/SemiAnalysis_/status/2056480117191303430
SemiAnalysis(对,就是那个)确认他们每天追踪 Claude Code 的 GitHub commit 数据,并报告自从 2026 年 2 月那张公开图表之后,曲线一直在右上角。他们对采用度的判断:银行还没用上,企业还在摸怎么用,合规和 IT 还在画护栏。「显然有用」和「真正进入分析师日常工作流」之间的空隙仍然非常大。一个研究机构开始把这玩意当基建级别去追踪本身就是领先指标。
@ryanmckeen [Claude Code]
Claude Code#27
https://x.com/ryanmckeen/status/2056422314032423046
把 Claude Code 推销成律所的「最后一英里」修补工具。「律师们,你所里有一堆最后一英里的问题。Filevine 修不了,你的 CRM 也修不了。你自己可以。Claude Code 里花 10 分钟。这就是新的优势。」典型的非编程专业服务场景,框成 DIY 流程自动化。和 Anthropic 昨天那个 Agent Manager 职位描述指向的形状一模一样——Claude Code 在企业里铺不开,瓶颈在「谁拥有它」,不在能力本身。
@T343402T [Claude Code]
Claude Code#28
https://x.com/T343402T/status/2056176484872552739
几个月前用 Claude Code 处理离婚文书:把他的短信记录分析、重新格式化成法庭需要的正式格式。他说自己一分律师费没花就打赢了。一个具体的非编程工作流——「短信记录 → 法庭文书」流水线,原本付给律师助理团队是五位数美元的活。任何愿意自己开循环的人,做高风险法律行政的门槛正在塌。
@nateherk [Claude Code]
Claude Code#29
https://x.com/nateherk/status/2056457627815596156
一条短到不像话却很关键的运维小记:「Claude Code 报 500 error,你正在慌——先读一下这个」。会火的原因:重度用户经常在心流深处撞上 500,肌肉记忆是疯狂重试,最后账单翻倍。正确动作其实是最无聊的那个——看状态页、换模型、停 5 分钟。值得收藏,因为你最需要它的时候最容易忘记翻出来。
@AspynPalatnick [OpenClaw]
OpenClaw#30
https://x.com/AspynPalatnick/status/2056489852678369388
走了一遍 NetClawd:一个用 Bankr 做链上交互 + LLM 的 OpenClaw agent,再把 Gitlawb skill 同时挂给 NetClawd 和 Bankr。NetClawd 写一个螺旋 SVG 生成器,把代码 push 到 Gitlawb 的去中心化 git 仓库。Bankr 同步节点、拉 repo、跑脚本,再通过 Net 协议把生成出来的 SVG 存到 Base 链上。软件永久存在去中心化 git 里,任何人都可以通过 Bankr 跑,输出永久可验证。一种新的「无信任软件执行 + 验证」形态。在前沿,也很怪。
@MaryamMiradi [Claude Code]
#31
https://x.com/MaryamMiradi/status/2056398215440642354
列了 18 条她用来把生产级 AI agent 工作塞进 20 美元/月套餐的具体习惯。重点:不用的 MCP server 断开(一个 server 每条消息就要加载 1.8 万 token),用 plan mode 同时在 CLAUDE.md 加一句「不到 95% 确信不要改动」,常跑 /context 和 /cost,到 60% 上下文就主动 /compact 而不是等 95% 自动 compact,把 CLAUDE.md 当索引控制在 200 行内不要当内容堆。整张单子读起来像运维 runbook,不像 engagement bait。
@Sauers_ [Claude Code]
Claude Code#32
https://x.com/Sauers_/status/2056429180405858632
演示了一个偷鸡的 meta-prompting 技巧:问 Claude 要做什么,把这个需求交给 Claude Code 实现,然后把对话 fork 回「还没问要做什么」的那一刻,把代码发给 Claude——Claude 回「天哪用户做的正是我想要的」。表面是段子,其实是把 Claude 自己的偏好同时当 spec 和当 QA 的紧凑模式。自洽循环会成为一种真正有用的 operator 技巧。
@lydiahallie [Claude Code]
Claude Code#33
https://x.com/lydiahallie/status/2056420694087594283
把 Claude Code 的 Learning Mode 设成 side project 的默认。这个选择有意思:她每天高强度用 Claude Code,但不想被它带笨,所以用 Learning Mode(/config → Output style → Learning)让 agent 解释 tradeoff、追问她,而不是直接出 diff。对本月越来越响的「agent 是不是在让我退化」焦虑给了具体回答。困难活上让 agent 跑全力,自己的项目上把 agent 配置成「来教你」的模式。
@milesdeutscher [Claude Code]
Claude Code#34
https://x.com/milesdeutscher/status/2056380375681978811
用 Claude Code 给自己造了一个 Personal OS 在跑整个人生:财务、行政事务、业务增长指标、其他上下文,全部实时跟踪。他类比成「Obsidian 第二大脑,但视觉和功能强 10 倍」。深度文章随后。值得注意的转变:「vibe code 整个生活运营」现在已经是一个连贯的个人生产力品类,不是段子。这是一个 2 周虚荣项目还是会留下来的基建,再过 90 天就看得到。
🗣 用户心声
用户心声

今天用户反复出现的 5 类痛点和诉求,原话引出来。

@sudoingX: 「Opus 4.7 max 以前很快。现在一个回答要等 3 分钟。你不是在为 fast 付钱,你是在为撤销 slow 付钱。」速度回归是真实的,用户开始记账了。

@mahou5x: 「一条话痨型 TypeScript 测试单跑 8000 token,每小时 10 次就是 8 万 token,光是测试输出。」没人提的那部分 token 账单,不在 prompt 里,在 Claude 默默读的东西里。

@savantchat: 「Claude Code 的 scale 问题不是上下文窗口,而是同一个代码库跨多个 session 时让模型保持自洽。」跨会话一致性,是新的上下文窗口。

@yyyiiillluuu 和 @driaforall(watchmen):两家都在做把执行轨迹变成可复用规则的插件。共同的失望点:记住过往会话 ≠ 从过往会话里学到东西。用户想要的是从他真做过的事里生成 skill,而不是从他写下来的笔记里。

@stevekrouse: 「把任务派给 3 年经验以下的人,普遍不如直接派给 Claude Code 高产。」初级人才管道的危机,没有任何一家模型实验室在认真解决。
📡 生态产品雷达
生态产品雷达

今天的精读里被提到 3 次以上的产品和项目。

claude-code-setup(Anthropic 官方插件)—— 扫你的项目,推荐 hooks/skills/MCP server/subagent 并自动接好。今天被提及约 15 次,大多是几乎相同文案的转推——engagement bait,但产品是真的。

claude-smart(@yyyiiillluuu)—— 开源插件,把失败/成功的执行结果变成跨项目可复用的规则。约 10 次提及。

claude-mem(@thedotmack)—— 持久上下文插件,在真实的过夜 Claude Code 跑任务中被用上(看 @metrox_eth 的机器人 RSI 循环)。

watchmen(@driaforall)—— 本地、开源插件,从你真做过的事里生成 CLAUDE.md 和 AGENTS.md。

rtk(Rust Token Killer)—— CLI 代理,把终端输出压缩 60-90% 后再喂进 Claude 上下文。多个用户报实测节约。

caveman —— 删掉 Claude 默认会加的话痨前缀,输出 token 减少 75% 左右。

claude-code-router —— 按任务类型把子任务路由到更便宜的模型。和 rtk 一起被引用。

agent-skills —— 一个立场强的 skill 库,强制结构化流程 + 验证关卡 + 反合理化清单。23 个 skill,跨 Claude Code/Cursor/Codex。

ECC / Everything Claude Code —— 38 个 agent、156 个 skill、72 条命令,Anthropic 黑客松获胜项目。

Hermes Agent / HermesOS —— 被反复提及为「比 OpenClaw 长得更快的开源替代品」。

aeon($AEON,@aaronjmars)—— 跑在 GitHub Actions 上用 Claude Code 驱动的自主 agent 框架;skill 是 markdown,memory 是 git commit,scheduler 是 cron YAML。

Step Plan(StepFun)—— 路由服务专治 Claude Code agent loop 的成本爆炸;接入 Claude Code、Cursor、Cline、Roo Code、Trae。

Coral —— 一条 SQL 同时查 GitHub/Slack/Sentry/Stripe/Datadog/本地文件,基准比直连 MCP 准 20%、便宜 2 倍、延迟低 42%。

Polarity —— agent 可观测性产品,主打「eval 95 分 → 生产 60 分」这条切入点。

M1 by Montage —— 把 agent 的 intent schema 编译成托管 UI 组件,agent 不必每一轮重发 UI,UI 生成的 token 砍 50-100 倍。

Higgsfield MCP —— 多个动态设计/广告制作 workflow 里和 Claude Code 配套使用。

gitlawb / OpenClaude —— 去中心化 git 网络,自带 Claude Code 风格的工具链;builder 圈在跟。
← 上一篇
SkillsVote 给 Agent 技能库装上投票闸门
下一篇 →
Loop 日报: 2026-05-20
← 返回所有文章

评论

加载中...
>_