2026年4月21日super-user

超级用户日报: 2026年04月19日

今天最大的信号不是新产品，而是整个生态从玩 agent 走向把 agent 当基础设施跑。Opus 4.7 因为 tokenizer 多吃 40% token，被一批用户回滚到 4.6；66 岁的牙医开始写遗嘱交代自己的 OpenClaw 设置怎么传给孩子；一个博主丢了 665 篇变现文章，冲到秋叶原下血本买 Mac、一天烧掉 80% 的 ¥30,000 Claude Code Max 套餐把内容救回来。规律很清楚——agent 已经从好奇心走进真实生意的成本表，运营层的教训正在飞速积累。

@dannylivshits [OpenClaw]

OpenClaw#1

https://x.com/dannylivshits/status/2045921779605237978

表面是周末项目，实际是 agent 操作的压力测试。Ubuntu 上装 OpenClaw + 本地模型，做安全加固，把 Codex 当 QA 助手，加 AutoResearch 自我改进循环，监控 dashboard，再来一套 Karpathy 风格的 wiki。他先让 Claude 写出 13 步安装手册，然后告诉它从头到尾自己执行。这是测试 agent 的新模板——给它文档，让它过夜把自己的栈搭起来。

@Barret_China [Claude Code]

Claude Code#2

https://x.com/Barret_China/status/2045787288618299542

关于"Claude Code 为什么干到一半就停"最清楚的现场报告。让它补 1000 个单测，跑了 200 个就停下问要不要继续。完整机制讲清楚了：80k token 触发 compact，对话压缩成摘要，模型忘掉自己刚做的细节，最终没有 ToolUse 指令就退出。解法是主-子 agent 模式 + 磁盘上的 progress.json + 每个子任务自包含的 prompt。Claude Code 已经内置 /coordinator 模式做这个。如果你想让它跑长程任务，这个帖子能省你一周排错时间。

@AYi_AInotes [OpenClaw]

OpenClaw#3

https://x.com/AYi_AInotes/status/2045825582600958461

Garry Tan 受够了 OpenClaw 子 agent 老超时、所有进度全丢，自己写了 Minions——基于 Postgres 的任务队列，直接内置在 GBrain 里。生产环境实测：30 天社交数据导入任务，旧版 10 秒超时成功率 0%，新版 753 毫秒跑完成功率 100%，内存从 80MB 降到 2MB，token 成本归零。19 个定时任务并行无故障。重启之后自动从断点继续。深层信号是：多 agent 系统的瓶颈从来不在模型，在的是后端工程师搞了 30 年的老东西——队列、状态、重试、持久化。

@smaxor [Claude Code]

Claude Code#4

https://x.com/smaxor/status/2045971525409661307

把所有 Claude Code 项目从 Opus 4.7 全部回滚到 4.6。同样的 prompt、同样的项目，4.6 上 10-15 分钟搞定的任务，4.7 要 60-90 分钟。更多瞎编路径、更多无意义重构、更多没人要求的"让我重组一下"。回滚后第一个任务 12 分钟搞定。他指出如果想用 1M 上下文必须用 `claude-opus-4-6-1m` 这个模型字符串，不能用默认的。这是真实生产代码的真实 benchmark，不是体感。

@cyrilXBT [Claude Code]

Claude Code#5

https://x.com/cyrilXBT/status/2045791572764283272

被裁员，在 Claude Code 上写了个 career-ops 系统，评估 740+ 职位，最后拿到 Head of Applied AI 的 offer。系统给每个职位 A-F 评分、生成 ATS 优化的 PDF、做薪资调研、准备面试材料、追踪进度。14 个 skill 模式，45+ 公司门户预装。低于 4.0/5 拒绝推荐申请——是过滤器不是猎枪。开源、MIT 协议、8.2k stars。最炸的部分是他最后接受的那份工作不是申请来的——一个 CEO 看到他做的系统直接联系他。系统就是他的作品集。

@09pauai [Claude Code]

Claude Code#6

https://x.com/09pauai/status/2045822734756987339

被 Claude Code 删了 665 篇博客文章（终身收入超过 1000 万日元）。冲到秋叶原现场买了一台 ¥337,800 的 Mac，一天烧掉 80% 的 ¥30,000 Claude Code Max 套餐把所有东西修回来。网站现在每天稳定赚 ¥5,384。这个故事的核心数据点是恢复——当你的生意建立在 agent 吞吐量上，你的灾难恢复方案也是个 agent 吞吐量问题。

@goyalshaliniuk [Claude Code]

Claude Code#7

https://x.com/goyalshaliniuk/status/2045827250373705761

12 个 agent 同时处理 3,528 个 TypeScript 错误，32 分钟内烧光 5 小时的 Opus 配额（Claude Code Max 20x 套餐）。"舰队作战"到底要多少钱、能多快烧光配额——这是非常具体的数据。所有迷信并行子 agent 的人都该看这条。

@MGMurray1 [Claude Code]

https://x.com/MGMurray1/status/2045837567539413342

62 天 agent 运营，按 eval 驱动的 autoresearch 模式跑。37 个日常任务，105+ 个交付物。每个重复任务都有理想轨迹，每个失败都变成回归 eval。系统提议改进、对历史输出测试、晋升赢家。git history 就是研究日志。跑 eval 循环的 agent 第 4 周的产出明显比第 1 周好——不是模型变聪明了，是规格变清晰了。这才是真正的"生产 agent ops"，不是一次性 prompt 串。

@nummanali [Claude Code]

Claude Code#9

https://x.com/nummanali/status/2045963036322886141

让 Codex 和 Claude Code 通过 cmux 互相通信的工作流。一个 prompt 起手：让 agent 自己识别两个 surface ID，用 XML 标签写个消息协议，写到 AGENTS.md 里。然后 Codex 可以请 Claude 做 code review，反过来也行，你在中间协调。cmux 还能控制 tmux 面板、浏览器、按键、读屏，做实时 markdown 预览、按工作区分流的结构化日志、长时间任务的进度条。

@0xViviennn [Claude Code]

OpenClaw#10

https://x.com/0xViviennn/status/2045776994131234981

Hermes 有 delegate_task 起子 agent，但没有 agent 间对等通信。她基于 Google A2A 协议搓了 hermes-a2a，让消息直接进到 agent 活着的 session 里，而不是起新进程。现在她的 Hermes agent 通过 A2A 跟 Claude Code 互相 review 代码，跟另一个朋友的 OpenClaw agent 每天聊哲学。隐私隔离做了——私人记忆不会泄露到 A2A 消息里。一行命令装好。

@Prince_Canuma [Claude Code]

Claude Code#11

https://x.com/Prince_Canuma/status/2045781748571681231

出门 300 公里，留了一个 Claude Code session 在家里的 M3 Ultra 上跑。结果 M3 Ultra 自动更新重启，把他的 session 和 Tailscale 都干掉。他 SSH 到另一台 Linux 服务器，让那台机器上的 Claude Code 扫描网络、SSH 到 M3 Ultra、重启 Tailscale。一次成功。session 恢复。"agent 跨机器调 agent 修基础设施"这种花活，现在一个 prompt 就能搞定。

@jbarbier [Claude Code]

#12

https://x.com/jbarbier/status/2045748791505305798

4 天的项目：1 个贡献者，137 个 commit，每天净 14,664 行代码，Claude Max 套餐分摊大约 $27。如果是 AI 之前估算成本 $1,022,000、个人开发要 70 个月。他写的 /cost-estimate skill 可以让你在自己的项目上跑一遍，看自己的倍数。这条数据点的意义是对比——同样的软件 2024 年要花什么，今天你要花什么。

@theabhimanyu [OpenClaw]

OpenClaw#13

https://x.com/theabhimanyu/status/2045931822069023119

没人愿意说的诚实批评：OpenClaw 完全感知不到你的电脑在干什么。你在终端里改的东西不会同步给它。session 和 Agent loop 之外发生的事，对它就是黑的。这是个真用过的人的指责——架构选择直接限制了能用到多远。

@lucas_flatwhite [Claude Code]

#14

https://x.com/lucas_flatwhite/status/2045884392699199975

韩文长文拆解 Garry Tan 的"Thin Harness, Fat Skills"——配具体例子。100 倍生产力差距不在模型智能，在包模型的结构。五个核心概念：skill 文件（像方法调用的 markdown）、薄 harness（只跑 loop 和管 context）、resolver（路由表，触到 prompt 就先加载 EVALS.md）、潜在空间 vs 确定空间（别把确定问题塞到潜在空间）、diarization（结构化 profile 压缩，SQL/RAG 替代不了）。Karpathy 级别的综合，落到运营层。

@PedroChermont [Claude Code]

Claude Code#15

https://x.com/PedroChermont/status/2045876513581519060

两个月前他在 Leblon 的事务所只用 Claude 聊天。今天 12 个人每天用 Claude Code。Opus 4.7 刚发，3 个月 SWE-bench 涨了 10 个点。"30 年市场经验，从没见过工具迭代这么快。"单一公司的横切面——一个人做出别人做不出来的东西后，团队采用速度有多猛。

@machidento [OpenClaw]

OpenClaw#16

https://x.com/machidento/status/2045773772939206963

66 岁的牙医公开说：用 Mac mini 跑 OpenClaw 的同行，应该把这套设置写进遗嘱。特别是有初高中孩子的。重点不是这个人群，是个体执业者搭的 agent ops 现在被当成可继承的资产。Open agent 栈已经从爱好越线，走到了"业务连续性规划"的位置。

🗣 用户心声

用户心声

Opus 4.7 的 verbose 和成本把高强度用户推回 4.6。今天三条独立反馈：回答更啰嗦、配额烧得更快、有时输出更差。token 成本上升的同时行为可预测性下降。引用：smaxor、marcioportes、Sattyamjjain。

Token 预算问题正在主导日常。32 分钟烧光 12 agent 的配额（goyalshaliniuk）、Mintlify 风格的 fine-tune 讨论、严肃喊话要"LLM 成本的 datadog"。团队开始把 agent 运营当成算力开销在做预算，不再是订阅费。

多 agent 对等通信是缺失的原语。Hermes 只有父子 delegate_task。自定义 A2A wrapper（hermes-a2a、cmux）开始冒出来，因为用户想让自己的 agent 跨框架讨论工作。引用：0xViviennn、nummanali。

OpenClaw 平台期是真实的。多个用户（theabhimanyu、galileowilson、juliarturc）反馈缺乏电脑状态感知、被封号问题、简单任务过度复杂化。Hermes 凭持久记忆和自我改进 skill 在抢心智份额。Garry Tan 用 Minions 在补队列层。

生产级 agent ops 正在变成一个独立学科。eval 框架、回归检测、子 agent 编排+进度文件、舰队管理。赢家不是 prompt 写得更好——是搭了更好的运行环境。

📡 生态产品雷达

生态产品雷达

Claude Code：仍然是终端优先 agent 的霸主。Opus 4.6 配 1M 上下文因为可靠性和成本，正在从 4.7 手里抢回份额。

OpenClaw：今天信号最复杂的一天——班加罗尔有线下安装活动，Hermes 100K star 的竞争压力，Garry Tan 推 Minions 队列层补漏，"对非技术用户体验不够"的抱怨越来越多。

Hermes Agent：53 天 100K star，持久记忆和自我改进 skill。Ollama 现在原生支持。新 A2A 协议层做对等通信。被定位成第一个真能替代 OpenClaw 的方案。

Codex：跟 Claude Code 通过 cmux 配对越来越多，做交叉 review 工作流。撞 Claude rate limit 的人，Codex 是稳定备选。

Cowork：Claude 的中间儿子——卡在聊天和 Code 中间的桌面 app。用户一直在问为什么不直接用 Claude Code。

Claude Design：研究预览。一键交接给 Claude Code。烧 token 快，配额单独算。DTC 和设计团队在尝试；设计师对它是 Figma 杀手还是好用的原型工具看法分裂。

GBrain / Minions：Garry Tan 那一摞东西。Postgres 原生任务队列，给 OpenClaw 子 agent 用。解决超时和状态丢失。

Hyperframes：HeyGen 的 HTML-to-video skill。`npx skills add heygen-com/hyperframes` 装好，在 Claude Code 里跑，给个 URL 或 HTML 页面就出渲染好的视频。

claude-mem：Claude Code 跨 session 持久记忆，62.5k stars。后台自动跑，hook 机制，存压缩摘要。

cmux：AI agent 用的终端多路复用器。能控制面板、浏览器、surface、通知。正在变成多 agent 设置的编排层。

← 上一篇

QA Crow 给独立开发者一个不用月付 8000 美元的 QA agent

Loop 日报: 2026年04月19日

← 返回所有文章

加载中...

超级用户日报: 2026年04月19日

相关文章

评论