2026年4月20日super-user

超级用户日报: 2026年04月19日

今天最大的信号不是新产品,而是整个生态从玩 agent 走向把 agent 当基础设施跑。Opus 4.7 因为 tokenizer 多吃 40% token,被一批用户回滚到 4.6;66 岁的牙医开始写遗嘱交代自己的 OpenClaw 设置怎么传给孩子;一个博主丢了 665 篇变现文章,冲到秋叶原下血本买 Mac、一天烧掉 80% 的 ¥30,000 Claude Code Max 套餐把内容救回来。规律很清楚——agent 已经从好奇心走进真实生意的成本表,运营层的教训正在飞速积累。
@dannylivshits [OpenClaw]
OpenClaw#1
https://x.com/dannylivshits/status/2045921779605237978
表面是周末项目,实际是 agent 操作的压力测试。Ubuntu 上装 OpenClaw + 本地模型,做安全加固,把 Codex 当 QA 助手,加 AutoResearch 自我改进循环,监控 dashboard,再来一套 Karpathy 风格的 wiki。他先让 Claude 写出 13 步安装手册,然后告诉它从头到尾自己执行。这是测试 agent 的新模板——给它文档,让它过夜把自己的栈搭起来。
@Barret_China [Claude Code]
Claude Code#2
https://x.com/Barret_China/status/2045787288618299542
关于"Claude Code 为什么干到一半就停"最清楚的现场报告。让它补 1000 个单测,跑了 200 个就停下问要不要继续。完整机制讲清楚了:80k token 触发 compact,对话压缩成摘要,模型忘掉自己刚做的细节,最终没有 ToolUse 指令就退出。解法是主-子 agent 模式 + 磁盘上的 progress.json + 每个子任务自包含的 prompt。Claude Code 已经内置 /coordinator 模式做这个。如果你想让它跑长程任务,这个帖子能省你一周排错时间。
@AYi_AInotes [OpenClaw]
OpenClaw#3
https://x.com/AYi_AInotes/status/2045825582600958461
Garry Tan 受够了 OpenClaw 子 agent 老超时、所有进度全丢,自己写了 Minions——基于 Postgres 的任务队列,直接内置在 GBrain 里。生产环境实测:30 天社交数据导入任务,旧版 10 秒超时成功率 0%,新版 753 毫秒跑完成功率 100%,内存从 80MB 降到 2MB,token 成本归零。19 个定时任务并行无故障。重启之后自动从断点继续。深层信号是:多 agent 系统的瓶颈从来不在模型,在的是后端工程师搞了 30 年的老东西——队列、状态、重试、持久化。
@smaxor [Claude Code]
Claude Code#4
https://x.com/smaxor/status/2045971525409661307
把所有 Claude Code 项目从 Opus 4.7 全部回滚到 4.6。同样的 prompt、同样的项目,4.6 上 10-15 分钟搞定的任务,4.7 要 60-90 分钟。更多瞎编路径、更多无意义重构、更多没人要求的"让我重组一下"。回滚后第一个任务 12 分钟搞定。他指出如果想用 1M 上下文必须用 `claude-opus-4-6-1m` 这个模型字符串,不能用默认的。这是真实生产代码的真实 benchmark,不是体感。
@cyrilXBT [Claude Code]
Claude Code#5
https://x.com/cyrilXBT/status/2045791572764283272
被裁员,在 Claude Code 上写了个 career-ops 系统,评估 740+ 职位,最后拿到 Head of Applied AI 的 offer。系统给每个职位 A-F 评分、生成 ATS 优化的 PDF、做薪资调研、准备面试材料、追踪进度。14 个 skill 模式,45+ 公司门户预装。低于 4.0/5 拒绝推荐申请——是过滤器不是猎枪。开源、MIT 协议、8.2k stars。最炸的部分是他最后接受的那份工作不是申请来的——一个 CEO 看到他做的系统直接联系他。系统就是他的作品集。
@09pauai [Claude Code]
Claude Code#6
https://x.com/09pauai/status/2045822734756987339
被 Claude Code 删了 665 篇博客文章(终身收入超过 1000 万日元)。冲到秋叶原现场买了一台 ¥337,800 的 Mac,一天烧掉 80% 的 ¥30,000 Claude Code Max 套餐把所有东西修回来。网站现在每天稳定赚 ¥5,384。这个故事的核心数据点是恢复——当你的生意建立在 agent 吞吐量上,你的灾难恢复方案也是个 agent 吞吐量问题。
@goyalshaliniuk [Claude Code]
Claude Code#7
https://x.com/goyalshaliniuk/status/2045827250373705761
12 个 agent 同时处理 3,528 个 TypeScript 错误,32 分钟内烧光 5 小时的 Opus 配额(Claude Code Max 20x 套餐)。"舰队作战"到底要多少钱、能多快烧光配额——这是非常具体的数据。所有迷信并行子 agent 的人都该看这条。
@MGMurray1 [Claude Code]
#8
https://x.com/MGMurray1/status/2045837567539413342
62 天 agent 运营,按 eval 驱动的 autoresearch 模式跑。37 个日常任务,105+ 个交付物。每个重复任务都有理想轨迹,每个失败都变成回归 eval。系统提议改进、对历史输出测试、晋升赢家。git history 就是研究日志。跑 eval 循环的 agent 第 4 周的产出明显比第 1 周好——不是模型变聪明了,是规格变清晰了。这才是真正的"生产 agent ops",不是一次性 prompt 串。
@nummanali [Claude Code]
Claude Code#9
https://x.com/nummanali/status/2045963036322886141
让 Codex 和 Claude Code 通过 cmux 互相通信的工作流。一个 prompt 起手:让 agent 自己识别两个 surface ID,用 XML 标签写个消息协议,写到 AGENTS.md 里。然后 Codex 可以请 Claude 做 code review,反过来也行,你在中间协调。cmux 还能控制 tmux 面板、浏览器、按键、读屏,做实时 markdown 预览、按工作区分流的结构化日志、长时间任务的进度条。
@0xViviennn [Claude Code]
OpenClaw#10
https://x.com/0xViviennn/status/2045776994131234981
Hermes 有 delegate_task 起子 agent,但没有 agent 间对等通信。她基于 Google A2A 协议搓了 hermes-a2a,让消息直接进到 agent 活着的 session 里,而不是起新进程。现在她的 Hermes agent 通过 A2A 跟 Claude Code 互相 review 代码,跟另一个朋友的 OpenClaw agent 每天聊哲学。隐私隔离做了——私人记忆不会泄露到 A2A 消息里。一行命令装好。
@Prince_Canuma [Claude Code]
Claude Code#11
https://x.com/Prince_Canuma/status/2045781748571681231
出门 300 公里,留了一个 Claude Code session 在家里的 M3 Ultra 上跑。结果 M3 Ultra 自动更新重启,把他的 session 和 Tailscale 都干掉。他 SSH 到另一台 Linux 服务器,让那台机器上的 Claude Code 扫描网络、SSH 到 M3 Ultra、重启 Tailscale。一次成功。session 恢复。"agent 跨机器调 agent 修基础设施"这种花活,现在一个 prompt 就能搞定。
@jbarbier [Claude Code]
#12
https://x.com/jbarbier/status/2045748791505305798
4 天的项目:1 个贡献者,137 个 commit,每天净 14,664 行代码,Claude Max 套餐分摊大约 $27。如果是 AI 之前估算成本 $1,022,000、个人开发要 70 个月。他写的 /cost-estimate skill 可以让你在自己的项目上跑一遍,看自己的倍数。这条数据点的意义是对比——同样的软件 2024 年要花什么,今天你要花什么。
@theabhimanyu [OpenClaw]
OpenClaw#13
https://x.com/theabhimanyu/status/2045931822069023119
没人愿意说的诚实批评:OpenClaw 完全感知不到你的电脑在干什么。你在终端里改的东西不会同步给它。session 和 Agent loop 之外发生的事,对它就是黑的。这是个真用过的人的指责——架构选择直接限制了能用到多远。
@lucas_flatwhite [Claude Code]
#14
https://x.com/lucas_flatwhite/status/2045884392699199975
韩文长文拆解 Garry Tan 的"Thin Harness, Fat Skills"——配具体例子。100 倍生产力差距不在模型智能,在包模型的结构。五个核心概念:skill 文件(像方法调用的 markdown)、薄 harness(只跑 loop 和管 context)、resolver(路由表,触到 prompt 就先加载 EVALS.md)、潜在空间 vs 确定空间(别把确定问题塞到潜在空间)、diarization(结构化 profile 压缩,SQL/RAG 替代不了)。Karpathy 级别的综合,落到运营层。
@PedroChermont [Claude Code]
Claude Code#15
https://x.com/PedroChermont/status/2045876513581519060
两个月前他在 Leblon 的事务所只用 Claude 聊天。今天 12 个人每天用 Claude Code。Opus 4.7 刚发,3 个月 SWE-bench 涨了 10 个点。"30 年市场经验,从没见过工具迭代这么快。"单一公司的横切面——一个人做出别人做不出来的东西后,团队采用速度有多猛。
@machidento [OpenClaw]
OpenClaw#16
https://x.com/machidento/status/2045773772939206963
66 岁的牙医公开说:用 Mac mini 跑 OpenClaw 的同行,应该把这套设置写进遗嘱。特别是有初高中孩子的。重点不是这个人群,是个体执业者搭的 agent ops 现在被当成可继承的资产。Open agent 栈已经从爱好越线,走到了"业务连续性规划"的位置。
🗣 用户心声
用户心声

Opus 4.7 的 verbose 和成本把高强度用户推回 4.6。今天三条独立反馈:回答更啰嗦、配额烧得更快、有时输出更差。token 成本上升的同时行为可预测性下降。引用:smaxor、marcioportes、Sattyamjjain。

Token 预算问题正在主导日常。32 分钟烧光 12 agent 的配额(goyalshaliniuk)、Mintlify 风格的 fine-tune 讨论、严肃喊话要"LLM 成本的 datadog"。团队开始把 agent 运营当成算力开销在做预算,不再是订阅费。

多 agent 对等通信是缺失的原语。Hermes 只有父子 delegate_task。自定义 A2A wrapper(hermes-a2a、cmux)开始冒出来,因为用户想让自己的 agent 跨框架讨论工作。引用:0xViviennn、nummanali。

OpenClaw 平台期是真实的。多个用户(theabhimanyu、galileowilson、juliarturc)反馈缺乏电脑状态感知、被封号问题、简单任务过度复杂化。Hermes 凭持久记忆和自我改进 skill 在抢心智份额。Garry Tan 用 Minions 在补队列层。

生产级 agent ops 正在变成一个独立学科。eval 框架、回归检测、子 agent 编排+进度文件、舰队管理。赢家不是 prompt 写得更好——是搭了更好的运行环境。
📡 生态产品雷达
生态产品雷达

Claude Code:仍然是终端优先 agent 的霸主。Opus 4.6 配 1M 上下文因为可靠性和成本,正在从 4.7 手里抢回份额。

OpenClaw:今天信号最复杂的一天——班加罗尔有线下安装活动,Hermes 100K star 的竞争压力,Garry Tan 推 Minions 队列层补漏,"对非技术用户体验不够"的抱怨越来越多。

Hermes Agent:53 天 100K star,持久记忆和自我改进 skill。Ollama 现在原生支持。新 A2A 协议层做对等通信。被定位成第一个真能替代 OpenClaw 的方案。

Codex:跟 Claude Code 通过 cmux 配对越来越多,做交叉 review 工作流。撞 Claude rate limit 的人,Codex 是稳定备选。

Cowork:Claude 的中间儿子——卡在聊天和 Code 中间的桌面 app。用户一直在问为什么不直接用 Claude Code。

Claude Design:研究预览。一键交接给 Claude Code。烧 token 快,配额单独算。DTC 和设计团队在尝试;设计师对它是 Figma 杀手还是好用的原型工具看法分裂。

GBrain / Minions:Garry Tan 那一摞东西。Postgres 原生任务队列,给 OpenClaw 子 agent 用。解决超时和状态丢失。

Hyperframes:HeyGen 的 HTML-to-video skill。`npx skills add heygen-com/hyperframes` 装好,在 Claude Code 里跑,给个 URL 或 HTML 页面就出渲染好的视频。

claude-mem:Claude Code 跨 session 持久记忆,62.5k stars。后台自动跑,hook 机制,存压缩摘要。

cmux:AI agent 用的终端多路复用器。能控制面板、浏览器、surface、通知。正在变成多 agent 设置的编排层。
← 上一篇
QA Crow 给独立开发者一个不用月付 8000 美元的 QA agent
下一篇 →
Loop 日报: 2026年04月19日
← 返回所有文章

评论

加载中...
>_