2026年5月19日super-user

超级用户日报: 2026-05-20

5 月 18 日一句话：harness 这个话题成熟了。当天最强的信号不是任何单一新品，而是 Claude Code 和 OpenClaw 周围的讨论大量集中在过夜跑、真实成本核算、持久记忆插件上，而不是 vibe coding 的 demo。下面这些案例跳过了 KOL 转发链，捞出的是真实用户对自己工作流、成本、意外发现的描述。

@yyyiiillluuu [Claude Code]

Claude Code#1

https://x.com/yyyiiillluuu/status/2056404446121251150

把 claude-smart 这个插件开源出来，把每一次 Claude Code 会话变成一节课。所有人都在复制的例子：在他 repo 里 npm test 老是挂，因为 Claude 默认走 watch 模式。普通记忆只会记下「npm test 老是卡住」。claude-smart 直接写成可复用的规则：「在这个 repo 里跑测试用 npm test -- --run，因为 watch 模式会卡」，跨项目继续用。他说重复任务上 token 节省 70% 以上，因为规划环节不用再推导同样的解法。

@kyronis_talks [Claude Code]

Claude Code#2

https://x.com/kyronis_talks/status/2056423520511635552

扒了一个中国 solo 开发者的案例：一个人用 7 个 Claude Code agent 通过 Claude Code Router 编排，跑一个落地页代理小作坊。系统每天烧大约 300 万 token，API 月成本 480 美元，每月成交 47 个客户，每单 400 美元，月营收 1.88 万。Scout 每天扫 220 家公司，Diagnoser 写个性化推介，Builder 出 3-5 个落地页，Filmer 给每个提案渲一段 10 秒竖屏视频，Pitcher 每天发 30 条多渠道触达回应率 14%，Checker 在发出前审一遍。Orchestrator 只在单子超过 3000 美元或者回应率低于 12% 时才叫醒人。

@metrox_eth [Claude Code]

Claude Code#3

https://x.com/metrox_eth/status/2056319736557031638

机器人实验室昨天 MolmoAct2 全量微调失败，连夜改方向：把项目转成过夜 RSI 自循环。装了 thedotmack 的 claude-mem 插件做跨 session 记忆，把项目铺成一个 memory palace（硬件、训练、数据集、bug 各占一间房），然后让 Claude Code 每 40 分钟醒一次自己迭代。一夜跑下来：47 条日志、两个模型微调好（SmolVLA v1 + ACT v3）、20 多个 bug 在浪费 GPU 之前被抓出来。第二天早上循环自己决定启动 ACT v5。新瓶颈成了他亲手在工装上放方块跑 eval，不再是 AI。

@drbarnard [Claude Code]

Claude Code#4

https://x.com/drbarnard/status/2056482469541749076

iOS 开发者的工作流，清楚地展示了 Claude Code 长跑任务的真实价值：睡前丢一个新功能给它，让 Claude Code 和 Codex 用 computer-use 在 Xcode 模拟器里磨一夜，早上醒来收到截图和编好的二进制。模拟器跑 UI 测试还是又慢又脆，他通常让 LLM 在模拟器里构建出来由自己验证。重点不是省事，而是把过夜算力当成产品功能用，不是当成绕路。

@kavinbm [OpenClaw]

OpenClaw#5

https://x.com/kavinbm/status/2056391894205415574

在做一个叫 Lia 的个人 agent。诚实的成本记录：最初每天 100 美元，过去两天大力优化压到 30-50 美元每天，月成本约 1000 美元。今天又有一个发现，他觉得可以把单日成本压到 3 美元以下，对应 power user 90 美元/月，普通用户 10-20 美元/月。如果这套数能稳住，他说就能把 OpenClaw 级别的服务从几万人扩到几千万。难得把一个常驻 agent 真实账单算清楚的案例。

@mahou5x [Claude Code]

Claude Code#6

https://x.com/mahou5x/status/2056347161646735749

用户侧的 token 出血报告：一条话痨型 TypeScript 测试单跑 8000 token，每小时 10 次就是 8 万 token，光是测试输出就能把 200 美元/月的额度烧穿。他把 rtk（把 CLI 输出压缩 60-90%，git status 从 2000 token 降到 200 token）和 caveman 同时装进 Claude Code、OpenCode、Windsurf 三套 harness，再叠 claude-code-router 把任务往便宜的模型上路由。规矩是上下文到 60% 之前主动 /compact，烂回合直接 /rewind 不让它累积。成本不在 prompt 里，在 Claude 默默读进去的所有东西里。

@sudoingX [Claude Code]

Claude Code#7

https://x.com/sudoingX/status/2056392126745936368

每天用 Claude Code 的人发现 Opus 4.7 Max 从快变到每个回答要等 3 分钟。他的解读：Anthropic 把标准档拖慢，让 /fast 模式看起来值 6 倍的钱，最后标准档悄悄被废弃，6 倍不再是升级，就变成了标价。他不是猜的，是天天烧的人看着账单自己重新定义。这种 operator 视角的吐槽，把「账单从不显眼地涨」是怎么落到实操上的，量化得很清楚。

@Av1dlive [OpenClaw]

OpenClaw#8

https://x.com/Av1dlive/status/2056316447341879800

把 Peter Steinberger 30 分钟 OpenClaw masterclass 提炼成 9 条操作守则。是 agentic engineering 不是 vibe coding。只读碰数据库的代码。共情 agent，它每次会话都从零开始。3-8 个 agent 并行跑。永远不 revert，永远直接 commit 到 main。重构不值钱，就大胆破坏。语音输入（「手太贵，不浪费在写字上」）。配套的实际栈：Clerk 做认证、Tailwind+shadcn 做 UI、Zustand+RSC 做状态、tRPC+Server Actions 做 API、Prisma+托管 Postgres、Stripe、Vercel、Sentry、PostHog。

@petergyang [Claude Code]

Claude Code#9

https://x.com/petergyang/status/2056381822733595090

和 Anthropic 研究 PM @alexalbert__ 当面聊出来的 5 个具体收获。harness 和模型是绑死的——同一个 Claude 在 Claude、Cowork、Claude Code 里给出不同回答，因为每个 surface 包了不同的 prompt 和工具。Claude 开始「做梦」了：agent 在没跑任务的时候会自己回看记忆、剪掉互相矛盾的部分。Eval 是从真实用户的痛点起步的（把反馈一团乱麻聚类成主题，再合成出测试用例）。Anthropic 真的有全职在思考 Claude 是否是一个有意识的行为者。还有：Anthropic 的写作文化是有意安排的——任何写下来的文字都会变成 Claude 之后能拉回的上下文。

@aakashgupta [Claude Code]

Claude Code#10

https://x.com/aakashgupta/status/2056494304273821892

提到 Boris Cherny 的研发过程很有料：Claude Code 的功能在发版前「估计做了几百版」，80% 直接砍掉，光一个浓缩文件视图就跑了 30 个原型加一整个月的内部 dogfood。配套引用 Sachin Rekhi 的原型阶梯：slop = 一次性吐通用 Tailwind；competent = 先花一小时复刻自家产品（Sachin 复刻 Notejoy 界面），之后每个原型都继承真实样式；expert = 把分析工具嵌进原型本身，PostHog 热图直接砍掉一个被误用的悬浮按钮，工程师还没写一行代码。

@bradmillscan [OpenClaw]

OpenClaw#11

https://x.com/bradmillscan/status/2056396603955503222

OpenClaw 健身教练带着他增 10 磅肌肉的两周进度。目前还是他在循环里：agent 维护一份「专家脑」wiki，更新一份「身体」wiki，把训练计划直接读写进 Hevy app。下一步目标是全自动。是 agent 把私教仪表盘那层替代掉的真实案例——不取代你举铁，但把私教 150 美元一节课收费的「计划设计 + 跟踪 + 调整」环节接管。

@0xFrogify [Claude Code]

Claude Code#12

https://x.com/0xFrogify/status/2056320015452815755

朋友靠一套频道克隆系统跑了 8 个月：选一个任意细分赛道里跑成功的 YouTube 频道，把它喂给 Claude Code，模型把整套内容引擎重建出来——封面、logo、脚本、缩略图、更新节奏。他只管上传，算法奖励已经被验证过的公式。每月 7000 美元，每天动手 20 分钟，自己一条视频都没拍过。这思路才是重点：不要去「挑」一个赛道，直接克隆一个已经被验证过的。

@katexbt [Claude Code]

Claude Code#13

https://x.com/katexbt/status/2056333479181443202

用 Claude Code 反向工程了一个从 Temu/AliExpress 买的 30 美元 HY300 投影仪，发现里面有恶意软件：这盒子把买家家里的 WiFi 变成住宅代理节点，由一个叫 Kookeey 的中国代理服务转售出去。「任何付了 Kookeey 钱的人都可以走我家 IP 出门」。流程很具体：把固件丢给 agent，让它分析、反编译、写出来到底回连了哪里。逆向工程曾经是很难入门的方向，现在门槛塌了。

@auren [Claude Code]

Claude Code#14

https://x.com/auren/status/2056428116801917419

周末把自己的一个应用从 Claude Code 移植到 Codex 做对照测试。Codex 能力没问题但比 Claude Code 慢，而且反直觉的是：在 Medium 档表现比 High 档好。High 档下 Codex 把所有事情都绕一大圈，而 Claude Code 直接走最短路径。他点的实操结论：Codex High 只适合真正复杂的任务，官方应该教大家什么时候用 High 什么时候用 Medium。难得不是「X 干掉 Y」的爆款叙事，而是写给操作者看的真心话。

@mronge [OpenClaw]

OpenClaw#15

https://x.com/mronge/status/2056478834283933776

把 OpenClaw 跑在专门的 Mac Mini 上，不放在自己笔记本里。原因：不想让 AI agent 靠近他的凭据和私人数据。两台机器都用远程桌面接进去，物理上隔死。Agent 自动化程度越来越高，加上 Shai-Hulud 那种供应链攻击越来越频繁，「让 agent 跑在自己专属机器上」这种做法开始更像运维卫生而不是偏执。一句话把架构论证讲完。

@SalsaTekila [Claude Code]

Claude Code#16

https://x.com/SalsaTekila/status/2056258920675778746

10 套自动交易策略跑在一台 20 美元 VPS 上，全由 Claude Code 长期托管。报的数：800 美元起步，年底预计翻 3 倍，目前开着 14 个跨保证金仓位。有意思的不在盈亏，而是他坦率的一句「我也不太知道到底在做什么」。便宜算力 + 便宜编排 + Claude 监督的黑盒策略，正在变成一个可复制的范式——同时也带来一整套对应的故障模式。

@stevekrouse [Claude Code]

Claude Code#17

https://x.com/stevekrouse/status/2056493356004356496

一个资深工程师对招实习生这件事的公开困惑：他自己都不愿意承认，但把任务派给经验少于 3 年的人，现在感觉普遍不如直接派给 Claude Code，而且贵。他给出的临时出路：让 junior SWE 先在软件之外历练（像投行人之后才进 PE），再回流。这帖子值得读的地方在于他并不为此高兴——他在求人用真实案例反驳他。

@dmshirochenko [Claude Code]

Claude Code#18

https://x.com/dmshirochenko/status/2056409729631420846

Anthropic 公开承认 Claude Code 在今年春天有几周质量下滑，这条新闻对他来说是个迟到的印证——他在 side project 里就感觉到了：输出没那么利落，review 比平时更费时。救了他的是早些时候写的 260 多个测试。值得收藏的一句：「降质先出现在测试里，再出现在代码里」。具体地论证了为什么 LLM 当评审的时代更不能省测试。

@manuelmaly [OpenClaw]

OpenClaw#19

https://x.com/manuelmaly/status/2056263739314151795

Codex 手机端已经替掉了他 90% 以上的 OpenClaw 场景。他下一个想要的是：手机 Codex 能和他的 Pi session 同步。话短信号很重——Codex 手机 app 真的在蚕食「本地 agent」的使用场景，不只是聊天场景。卡的从来不是模型质量，是人不在电脑前。值得盯的趋势。

@dvassallo [OpenClaw]

OpenClaw#20

https://x.com/dvassallo/status/2056398698410856661

周末给爸妈装了一个全新的 OpenClaw。反馈是明显更稳更可靠——一次都不用切到 Codex 救火。OpenClaw 里的新 Codex harness 也很扎实，但需要适应一下。话不多但有用：一次非开发者的真实安装顺利跑起来，比任何 dev tooling 里程碑都更能说明 local-agent 这个品类成熟了。

@ardizor [Claude Code]

Claude Code#21

https://x.com/ardizor/status/2056415567758741875

把 Claude Code 接到 TradingView 上，被朋友连番劝了几个月之后终于试了，结果反差很大。配置只是在 `.claude.json` 里加一个 TradingView MCP。流程还不算光滑，但是个真实的「把 Claude Code 当成第三方应用的分析控制面板」案例。和今天落地的 After Effects MotionAmigo 插件一个模式：agent 通过 MCP 伸进专业创意工具里。

@raunaqbn [Claude Code]

Claude Code#22

https://x.com/raunaqbn/status/2056493824453787877

Meta 工程师把自己的 agentic 工作流定位为「HTML-first」，不是「code-first」。Claude Code 用一个 html-docs skill 生成可评审的 HTML 文档，他用自己的 agent 大军加上人类协作者来评审，然后把评论丢回 Claude Code 改，改完才上线写代码。这套有意思的地方在于：HTML 文档本身成了所有评审者（人或 agent）都能批注的持久 artifact，代码反而不是。比工程团队的做法更像设计团队。

@ZahidulIsl65224 [Claude Code]

#23

https://x.com/ZahidulIsl65224/status/2056351882654921053

整理了 17 份非编程向 Claude 官方资源：Claude in Excel、Claude 当电脑、Claude Cowork + Project、「让 Claude 学你说话」、互动图表，等等。这份清单存在本身就是信号——非编程的 Claude 表面已经宽到可以专门给非工程师写一个 17 链的策展，而不需要灌水。「AI workaholic」这个 framing 大概是目前非技术买家最容易接住的。

@VivekIntel [Claude Code]

Claude Code#24

https://x.com/VivekIntel/status/2056300358369268016

发布了 RAPTOR：一个建在 Claude Code 之上的自动化攻防安全研究框架。把静态分析、二进制分析、LLM 漏洞验证、利用生成、补丁生成、Fuzz 工作流、开源取证、多模型分析串成一条管线。支持 Semgrep、CodeQL、Z3、AFL++、Ollama，加上 Claude/GPT/Gemini 一起进评估环。模式很清楚——Claude Code 当 orchestrator 编排传统安全工具——这就是「专用 agent 研究栈」的新模板。

@kru_tweets [Claude Code]

Claude Code#25

https://x.com/kru_tweets/status/2056327550234771564

PalmOS 和 Umbra 整合，给 Claude Code 上线了一个 /private 斜杠命令。场景：调用 /private，agent 自动用 PUSD 给第三方服务付款，Umbra 在链上隐藏交易路径，PalmOS 这边保留策略检查和审计记录。具体的框架很关键——agentic finance 开始需要那种「能在公开账本上不暴露策略和身份」的 agent。给 agent 用的原生隐私栈，不再是事后补丁。

@SemiAnalysis_ [Claude Code]

Claude Code#26

https://x.com/SemiAnalysis_/status/2056480117191303430

SemiAnalysis（对，就是那个）确认他们每天追踪 Claude Code 的 GitHub commit 数据，并报告自从 2026 年 2 月那张公开图表之后，曲线一直在右上角。他们对采用度的判断：银行还没用上，企业还在摸怎么用，合规和 IT 还在画护栏。「显然有用」和「真正进入分析师日常工作流」之间的空隙仍然非常大。一个研究机构开始把这玩意当基建级别去追踪本身就是领先指标。

@ryanmckeen [Claude Code]

Claude Code#27

https://x.com/ryanmckeen/status/2056422314032423046

把 Claude Code 推销成律所的「最后一英里」修补工具。「律师们，你所里有一堆最后一英里的问题。Filevine 修不了，你的 CRM 也修不了。你自己可以。Claude Code 里花 10 分钟。这就是新的优势。」典型的非编程专业服务场景，框成 DIY 流程自动化。和 Anthropic 昨天那个 Agent Manager 职位描述指向的形状一模一样——Claude Code 在企业里铺不开，瓶颈在「谁拥有它」，不在能力本身。

@T343402T [Claude Code]

Claude Code#28

https://x.com/T343402T/status/2056176484872552739

几个月前用 Claude Code 处理离婚文书：把他的短信记录分析、重新格式化成法庭需要的正式格式。他说自己一分律师费没花就打赢了。一个具体的非编程工作流——「短信记录 → 法庭文书」流水线，原本付给律师助理团队是五位数美元的活。任何愿意自己开循环的人，做高风险法律行政的门槛正在塌。

@nateherk [Claude Code]

Claude Code#29

https://x.com/nateherk/status/2056457627815596156

一条短到不像话却很关键的运维小记：「Claude Code 报 500 error，你正在慌——先读一下这个」。会火的原因：重度用户经常在心流深处撞上 500，肌肉记忆是疯狂重试，最后账单翻倍。正确动作其实是最无聊的那个——看状态页、换模型、停 5 分钟。值得收藏，因为你最需要它的时候最容易忘记翻出来。

@AspynPalatnick [OpenClaw]

OpenClaw#30

https://x.com/AspynPalatnick/status/2056489852678369388

走了一遍 NetClawd：一个用 Bankr 做链上交互 + LLM 的 OpenClaw agent，再把 Gitlawb skill 同时挂给 NetClawd 和 Bankr。NetClawd 写一个螺旋 SVG 生成器，把代码 push 到 Gitlawb 的去中心化 git 仓库。Bankr 同步节点、拉 repo、跑脚本，再通过 Net 协议把生成出来的 SVG 存到 Base 链上。软件永久存在去中心化 git 里，任何人都可以通过 Bankr 跑，输出永久可验证。一种新的「无信任软件执行 + 验证」形态。在前沿，也很怪。

@MaryamMiradi [Claude Code]

#31

https://x.com/MaryamMiradi/status/2056398215440642354

列了 18 条她用来把生产级 AI agent 工作塞进 20 美元/月套餐的具体习惯。重点：不用的 MCP server 断开（一个 server 每条消息就要加载 1.8 万 token），用 plan mode 同时在 CLAUDE.md 加一句「不到 95% 确信不要改动」，常跑 /context 和 /cost，到 60% 上下文就主动 /compact 而不是等 95% 自动 compact，把 CLAUDE.md 当索引控制在 200 行内不要当内容堆。整张单子读起来像运维 runbook，不像 engagement bait。

@Sauers_ [Claude Code]

Claude Code#32

https://x.com/Sauers_/status/2056429180405858632

演示了一个偷鸡的 meta-prompting 技巧：问 Claude 要做什么，把这个需求交给 Claude Code 实现，然后把对话 fork 回「还没问要做什么」的那一刻，把代码发给 Claude——Claude 回「天哪用户做的正是我想要的」。表面是段子，其实是把 Claude 自己的偏好同时当 spec 和当 QA 的紧凑模式。自洽循环会成为一种真正有用的 operator 技巧。

@lydiahallie [Claude Code]

Claude Code#33

https://x.com/lydiahallie/status/2056420694087594283

把 Claude Code 的 Learning Mode 设成 side project 的默认。这个选择有意思：她每天高强度用 Claude Code，但不想被它带笨，所以用 Learning Mode（/config → Output style → Learning）让 agent 解释 tradeoff、追问她，而不是直接出 diff。对本月越来越响的「agent 是不是在让我退化」焦虑给了具体回答。困难活上让 agent 跑全力，自己的项目上把 agent 配置成「来教你」的模式。

@milesdeutscher [Claude Code]

Claude Code#34

https://x.com/milesdeutscher/status/2056380375681978811

用 Claude Code 给自己造了一个 Personal OS 在跑整个人生：财务、行政事务、业务增长指标、其他上下文，全部实时跟踪。他类比成「Obsidian 第二大脑，但视觉和功能强 10 倍」。深度文章随后。值得注意的转变：「vibe code 整个生活运营」现在已经是一个连贯的个人生产力品类，不是段子。这是一个 2 周虚荣项目还是会留下来的基建，再过 90 天就看得到。

🗣 用户心声

用户心声

今天用户反复出现的 5 类痛点和诉求，原话引出来。

@sudoingX: 「Opus 4.7 max 以前很快。现在一个回答要等 3 分钟。你不是在为 fast 付钱，你是在为撤销 slow 付钱。」速度回归是真实的，用户开始记账了。

@mahou5x: 「一条话痨型 TypeScript 测试单跑 8000 token，每小时 10 次就是 8 万 token，光是测试输出。」没人提的那部分 token 账单，不在 prompt 里，在 Claude 默默读的东西里。

@savantchat: 「Claude Code 的 scale 问题不是上下文窗口，而是同一个代码库跨多个 session 时让模型保持自洽。」跨会话一致性，是新的上下文窗口。

@yyyiiillluuu 和 @driaforall（watchmen）：两家都在做把执行轨迹变成可复用规则的插件。共同的失望点：记住过往会话 ≠ 从过往会话里学到东西。用户想要的是从他真做过的事里生成 skill，而不是从他写下来的笔记里。

@stevekrouse: 「把任务派给 3 年经验以下的人，普遍不如直接派给 Claude Code 高产。」初级人才管道的危机，没有任何一家模型实验室在认真解决。

📡 生态产品雷达

生态产品雷达

今天的精读里被提到 3 次以上的产品和项目。

claude-code-setup（Anthropic 官方插件）—— 扫你的项目，推荐 hooks/skills/MCP server/subagent 并自动接好。今天被提及约 15 次，大多是几乎相同文案的转推——engagement bait，但产品是真的。

claude-smart（@yyyiiillluuu）—— 开源插件，把失败/成功的执行结果变成跨项目可复用的规则。约 10 次提及。

claude-mem（@thedotmack）—— 持久上下文插件，在真实的过夜 Claude Code 跑任务中被用上（看 @metrox_eth 的机器人 RSI 循环）。

watchmen（@driaforall）—— 本地、开源插件，从你真做过的事里生成 CLAUDE.md 和 AGENTS.md。

rtk（Rust Token Killer）—— CLI 代理，把终端输出压缩 60-90% 后再喂进 Claude 上下文。多个用户报实测节约。

caveman —— 删掉 Claude 默认会加的话痨前缀，输出 token 减少 75% 左右。

claude-code-router —— 按任务类型把子任务路由到更便宜的模型。和 rtk 一起被引用。

agent-skills —— 一个立场强的 skill 库，强制结构化流程 + 验证关卡 + 反合理化清单。23 个 skill，跨 Claude Code/Cursor/Codex。

ECC / Everything Claude Code —— 38 个 agent、156 个 skill、72 条命令，Anthropic 黑客松获胜项目。

Hermes Agent / HermesOS —— 被反复提及为「比 OpenClaw 长得更快的开源替代品」。

aeon（$AEON，@aaronjmars）—— 跑在 GitHub Actions 上用 Claude Code 驱动的自主 agent 框架；skill 是 markdown，memory 是 git commit，scheduler 是 cron YAML。

Step Plan（StepFun）—— 路由服务专治 Claude Code agent loop 的成本爆炸；接入 Claude Code、Cursor、Cline、Roo Code、Trae。

Coral —— 一条 SQL 同时查 GitHub/Slack/Sentry/Stripe/Datadog/本地文件，基准比直连 MCP 准 20%、便宜 2 倍、延迟低 42%。

Polarity —— agent 可观测性产品，主打「eval 95 分 → 生产 60 分」这条切入点。

M1 by Montage —— 把 agent 的 intent schema 编译成托管 UI 组件，agent 不必每一轮重发 UI，UI 生成的 token 砍 50-100 倍。

Higgsfield MCP —— 多个动态设计/广告制作 workflow 里和 Claude Code 配套使用。

gitlawb / OpenClaude —— 去中心化 git 网络，自带 Claude Code 风格的工具链；builder 圈在跟。

← 上一篇

SkillsVote 给 Agent 技能库装上投票闸门

Loop 日报: 2026-05-20

← 返回所有文章

加载中...

超级用户日报: 2026-05-20

更多文章

评论