2026年5月19日super-user

超级用户日报: 2026-05-19

5月17日这天，Anthropic 表面上的光鲜和底下 agent 经济的真实成本第一次正面撞上。同一天，Anthropic CFO 在 ILTB 播客里说 Anthropic 自己90%以上的代码现在都是 Claude Code 写的；同一天，Peter Steinberger 把 OpenClaw 上个月的账单晒出来——3 个人的团队跑 100 个 Codex 实例，一个月 6030 亿 token，130 万美元。用户端的内容也密集：200 美金本金的 Polymarket bot 27 天滚到 14300，一位带三个 7 岁以下孩子的全职妈妈一个月把 YouTube 频道从 200 涨到 12000 订阅，有人花 78 小时和 600 美元 token 做了个 Apple Watch 手腕手势控制系统，还有人用 9 美金的 ESP32 做出了能穿墙追踪 17 个身体关键点的 WiFi 系统。评论区共识也一边倒：harness 现在比模型本身更重要——Cline 在 Terminal-Bench 2.0 上跑同一个 Opus 4.7 比 Claude Code 高 4.8 分。今天这份报告有 40+ 个案例，有的是工作流金矿，有的是警告，全是用户实打实在用的东西。

@SimslearnAi [Claude Code]

Claude Code#1

https://x.com/SimslearnAi/status/2055989970700325166

200 美金本金的 Polymarket bot 27 天滚到 14300 美元，271 笔交易，胜率 74%，夏普 2.47，全自动跑。技术栈：Claude Code 加 4 个开源 repo 加 25 美金/月的订阅。bot 分析了 8600 万笔 Polymarket 交易，从 14000 个钱包里筛出 47 个满足"100 笔以上交易、胜率 70% 以上"，每个市场跑 3 个独立 agent（套利、收敛、跟单巨鲸），两个 agent 同意才下单。出场逻辑模仿盈利巨鲸真实行为：91% 的人都不撑到结算，所以 bot 在巨鲸之前 85% 预期涨幅就先撤。Anthropic 工程师在咖啡店看到他屏幕直接搬椅子过来，因为那不是普通交易设置。

@brivael [Claude Code]

https://x.com/brivael/status/2056118714706121027

从 Davinci 用到 Opus 4.7，4 年的 LLM 使用经验后他得出结论：解锁的不是 agent 本身，是 agent 之前的工作。流程是：1-2 分钟语音脑暴 → 让模型生成 1000-1500 行的 RFC（是 spec，不是代码）→ 迭代 3-4 次 → 这时候才让 agent 跑，它不再做创意选择，只是确定地执行。"RFC 才是产品，代码只是副产物。" 更扎心的推论：栈越干净、越标准、测试越完整，你越不需要复审 agent 生成的代码。乱糟糟的 legacy 强迫你逐行 review。所以架构投资不是成本，是 agent 带宽的乘数。

@Suryanshti777 [Claude Code]

Claude Code#3

https://x.com/Suryanshti777/status/2056103450308645057

高级工程师用 Claude Code 的方式不是打字更快，而是把开发拆成并行的 AI 工作流——一个 agent 负责调研，一个负责架构，一个写代码，一个 review，一个跑边界测试。每个工作记录下来，互相隔离，在独立 worktree 里同时跑。一个开发者现在可以同时跑 5-10 条工程流水线。"单兵开发者"的定义彻底变了。

@heygurisingh [Claude Code]

Claude Code#4

https://x.com/heygurisingh/status/2056020834326810659

Claude Code 的作者 Boris Cherny 每天同时跑 10-15 个 Claude session。终端 5 个，web 5-10 个，全部并行出代码。他真正的武器是 CLAUDE.md：Claude 每犯一次错，团队就加一条规则，永远不再犯。他每次纠正后必加一句："Update your CLAUDE.md so you don't make that mistake again." Claude 给自己写规则。用得越久，它对你的代码库越懂。他 6 个月没写过一行 SQL，全靠 Claude 通过 CLI 拉 BigQuery。Claude Code 现在贡献了 GitHub 上所有公开 commit 的约 4%。

@sairahul1 [Claude Code]

https://x.com/sairahul1/status/2056050387678024143

他用 430 小时跑了 600 万 token 测出来一组数据，正好对上 Boris Cherny 自己在播客上公开说的：73% 的 token 在 Claude 读你 prompt 之前就已经浪费了。拆开看——14% 烧在 CLAUDE.md 臃肿上，13% 在反复读历史记录，11% 在被遗忘的 hook 里。最扎人的结论：所谓"Claude 变笨了"几乎从来不是模型问题，是 harness 的数学问题。先看播客，再看每个浪费点 30 秒能修的方案。

@fujitech_ai [Claude Code]

Claude Code#6

https://x.com/fujitech_ai/status/2055887900446019599

一个实习生问他：用 Claude Code 写功能，自己的工程能力到底有没有积累。他的回答很直接：别再试图一行一行读代码了。AI 时代要练的是设计能力和需求定义能力——能掌握文件夹/文件层级在写什么、能在功能层面解释认证机制和 API 设计、能讲清楚为什么选这个技术栈。实现细节扔给 Claude 就行。具体流程：不要直接跑代码，先用 plan 模式把设计和文件夹结构敲定，再让 agent 实现。如果在 legacy 代码里没法主导设计，就业余时间另起一个干净环境自己设计实现，那是最好的训练。AI 负责速度，你负责"为什么这么设计"。

@yaohui12138 [Claude Code]

https://x.com/yaohui12138/status/2055849330498736619

花一天测完了最近开源的 7 个 PPT skill 项目。结论：AI 生成的 PPT 丑，不是 AI 能力不行，是你没给它正确的审美约束系统。每个 repo 都把"什么样的 PPT 人类才愿意看"编译成了 AI 能理解的规则。frontend-slides（17k 星）先生成 3 个不同风格预览图让你挑再做完整 deck。huashu-design（13k 星）一句 Prompt 同时产 HTML deck、可编辑 PPTX、MP4、交互原型。guizang-ppt-skill（7k 星）甚至禁止自定义 hex 颜色值来保护美学。open-slide 把每张幻灯片做成 React 组件，点击任意元素留 comment 让 agent 迭代。共同点都是把审美编译成 AI 能跟的规则。

@arceyul [Claude Code]

Claude Code#8

https://x.com/arceyul/status/2056108436224430139

Superpowers（GitHub 已超过 94000 星）把 Claude Code、Codex、Cursor、Gemini CLI、OpenCode、Copilot CLI 变成真正的 senior 开发者，靠的是强制 7 阶段工作流：Brainstorm → Spec → Plan → TDD → Subagents → Review → Ship。没写测试就先写代码？删掉。在隔离的 git worktree 里并行调度子 agent。写一行代码前必须先 brainstorm。项目大到一定程度，普通 agent 开始幻觉、破测试、留死代码。Superpowers 用流程把这一切按住。MIT 协议。

@DimitrisPapail [Claude Code]

Claude Code#9

https://x.com/DimitrisPapail/status/2056015459456106642

他在日常用 Claude Code 中验证了自己 Memento 论文的结论：Claude Code 一段闲置后会清掉 KV 缓存，回来时模型明显变弱——它不再是延续轨迹，而是从文本 token 重建模拟当时的状态，这比直接延续难得多。论文里量化过这个效应：KV state（soft embedding）携带的信息文本 token 是带不走的，即便注意力是 mask 过的。冲掉缓存等于丢精度。他的诉求很简单：别每隔 X 小时就清空缓存。

@HowToAI_ [Claude Code]

Claude Code#10

https://x.com/HowToAI_/status/2055874650455101873

有人开源了一个 Tauri（Rust）单体应用，同时替代 ElevenLabs Creator（99 美元/月）和 WisprFlow Pro（15 美元/月），100% 本地运行。3 秒音频克隆任意声音，7 个 TTS 引擎，23 种语言，内置 MCP server 让 Claude Code/Cursor/Cline 用你克隆的声音说话，本地 LLM 在 TTS 前重写台词保持人设，pedalboard 音效内置。支持 MLX/CUDA/ROCm/Intel Arc/DirectML/CPU。23.4K 星，MIT。

@o0a98 [Claude Code]

Claude Code#11

https://x.com/o0a98/status/2055935756904915405

一个 21 岁的中国年轻人 3 个月前用 Claude Code 做了个 Roblox 游戏。他一行 Lua 都没写。3 个月调试和迭代，AI 自己搭完了游戏所有系统。现在：日活 5000 玩家，月入 15750 美元。值得讨论的问题：编程在变成耐心的活儿，而不是代码能力的活儿？

@Web3Arabs [Claude Code]

Claude Code#12

https://x.com/Web3Arabs/status/2056049938472042892

一个中国开发者在 Claude Code 里造了 7 个 AI agent 给 47 个创业公司每月做落地页，每家收 600 美元。这 7 个 agent 先扫小城市的 Google Maps，找还没建网站的创业公司，整个周末把每家从立项到带视频和营销文案的最终原型全部跑完。没有团队、没有项目经理、没有客服。一台 MacBook、一把 API key，全由 Claude Code Router 调度。日均 ~3M token，月度 API 账单约 480 美元。47 家 × 600 美元，从一台笔记本跑出严肃的吞吐量。

@gippp69 [Claude Code]

Claude Code#13

https://x.com/gippp69/status/2055988726199640236

用 Claude Code + Swift + iPhone 模拟器在 90 秒内做出一个 iPhone 考试备考聊天 app。垂类：护理学生考前需要快速答案。功能就是收藏题目、预设考试 prompt、简单解释、6.99 美元/月解锁无限次。180 个付费用户算下来扣掉苹果的钱大约 1200 美元/月。大多数人看到的是 90 秒 demo，他看到的是一个付费垂直 app 的模板。

@evilsocket [Claude Code]

Claude Code#14

https://x.com/evilsocket/status/2056024467789271435

同一个模型、同样的上下文、同样的项目。Claude Code 用 Opus max effort 写了个 feature。/security-review 用 Opus max effort 没发现问题。然后一个全新的 Claude Code session，零上下文，他随便一个 prompt，找到了认证绕过漏洞。这事儿怎么解释？隐含答案：带着上文的 security review 会被带偏，倾向于认为原实现是对的。一个干净 session 才能给出对抗性视角。

@AYi_AInotes [Claude Code]

OpenClaw#15

https://x.com/AYi_AInotes/status/2055954675526934642

Garry Tan 刚开源 GBrain，定位不是又一个 RAG 玩具，是一个完整的个人知识操作系统。装到 OpenClaw、Hermes、Claude Code 上，它能记住你的人际关系、决策轨迹、长期认知演化。标准 RAG 4 层，GBrain 直接堆到 8 层。前 4 层是基础检索的全面升级，真正的杀手级差异在后 4 层——把每次对话从零开始的 agent 升级成有终身记忆加自我进化的 agent。Garry 自己的生产环境跑了 17888 页、4383 人、723 家公司。

@KKaWSB [Claude Code]

Claude Code#16

https://x.com/KKaWSB/status/2055819590299505133

DeepSeek-TUI 一周冲到 GitHub Trending 第一，22000 星。Rust 写的终端 coding agent，被叫做"开源版 Claude Code"。完整对接 DeepSeek V4 满血版 100 万 token 上下文，写代码、跑命令、管 git、自己派子 agent 并行干活。三种模式：Plan 只读探索、Agent 每步等你点头、YOLO 全自动梭哈。每改一次代码自动跑 LSP 诊断，错误警告贴脸提示，还能装 skills。如果想用 DeepSeek 在终端写代码又不想付 Claude Code 订阅，直接装这个。

@grapeot [Claude Code]

Claude Code#17

https://x.com/grapeot/status/2055857098345652344

Agent Runtime 正在成为 AI 下一个主战场。Cline 在 Terminal-Bench 2.0 跑了组关键数据：同一个 claude-opus-4.7，Cline 上 74.2%，Claude Code 上 69.4%。4.8 分的差距相当于把模型从 opus-4.6 升到 4.7 的收益。Cline 自己的 hill climbing 实验更夸张——不换模型，只优化 harness 的 prompt、工具定义和上下文管理，从 47% 拉到 57%。自上而下的信号也在对齐：DeepSeek 招 Agent Harness PM，OpenAI 成立 Deployment Co 做全栈 agent 服务，Anthropic 发 Claude Cowork 和 Partner Network。token 价格归零（DeepSeek V4-Flash 只有 GPT-5.5 的 1/107），模型层护城河消失。价值捕获只能往上走，runtime 层是唯一能建切换成本的地方。

@oikon48 [Claude Code]

Claude Code#18

https://x.com/oikon48/status/2056134414992888042

Anthropic 刚发了 Claude Code 在大代码库的最佳实践。三个核心点：（1）让代码库对 Claude 来说易于导航。每次塞太多上下文会降智，塞太少又要靠探索。最有效的入场动作是让代码库本身对 Claude 可读。（2）随着模型进化主动维护 CLAUDE.md。给老模型写的指令对新模型可能是反作用的，团队应该每 3-6 个月或主要模型发布后重新审视 CLAUDE.md 结构。（3）明确分配 Claude Code 的运营和推广责任。没有专人/团队维护标准化的 CLAUDE.md 层级和精选的 skill/plugin 集，知识就锁在团队内、推广就停滞。大企业最顺的部署是早期就把工程、信息安全、治理拉到一个跨部门工作组里。

@cyrilXBT [Claude Code]

Claude Code#19

https://x.com/cyrilXBT/status/2056085235708903569

让 Claude Code 强大的有三样：Skills（任务指令）、Hooks（护栏）、MCP server（全新能力）。MCP 是改变一切的那一个。没 MCP 时 Claude 读写代码。有 MCP 后 Claude 浏览 web、管数据库、截屏、跨工具栈自动操作。配置 5 分钟：编辑 .mcp.json、加 server、重启。但没人强调的警告：每个 MCP server 都吃你的 context window。装 15-20 个 server 你的 context 预算在 Claude 完成复杂任务前就花光了。模式：只装当前工作流真正需要的 server。工作流稳定后转化为 Skill——同样效果，token 成本一小部分。

@aakashgupta [Claude Code]

Claude Code#20

https://x.com/aakashgupta/status/2056133169955615197

他采访了 5 位做出最大 AI 原型工具的人——Sachin Rekhi（Notejoy/Reforge）、Boris Cherny（Claude Code）、Colin Matthews（Dazl）、Dan Olsen（精益产品手册作者）、Nadav Abrahami（Wix 联创）。5 个不同起点。他们都殊途同归到同一个动作：让 AI 在动手前先停一下。Sachin 截屏现有产品做出可复用基线模板。Boris 同一个 feature 生成 50-100 个版本然后砍掉 80%。Colin 对 Bolt 说"先做计划，不要写代码"。Dan 先写一个 mini-PRD 给 AI 做参照。Nadav：任何模糊表达统计上都会被误解。约束 AI 那 30 秒决定了接下来 30 分钟产物能不能上线。

@aakashgupta [Claude Code]

Claude Code#21

https://x.com/aakashgupta/status/2056041068416971246

Pawel Huryn 作为 PM 的工作面分配：Dispatch ~35%（手机端，逛街通勤时跑并行后台任务），Code Web ~35%（云端 VS Code、GitHub 同步、笔记本可以离线），Claude Code ~25%（终端配 hooks 和子 agent 和本地 MCP 隔离），Cowork 做日常文件类知识工作，Chat 只剩 5% 做语法检查。关于 n8n vs Claude Code：n8n 没死。生产自动化需要带条件分支、重试逻辑、硬权限控制的代码——指令没法被忽视因为它就是代码。Claude Code 跑在文本文件和 skill 上，agent 能漂移。个人工作流靠学习复利用 Claude Code，确定性生产流程用 n8n。

@stockthoughts81 [Claude Code]

Claude Code#22

https://x.com/stockthoughts81/status/2056047457209930129

Anthropic CFO 本周在 ILTB 播客上：财务团队有 70+ Claude skill，外加一个"月度财务复盘"skill 已经做到 90-95% 完成度，讨论从"发生了什么"变成"我们要做什么"。以前要花几个小时的周报现在 30 分钟搞定。其他可记的数字：NDR > 500%，跟 Google 和 Broadcom 签了 5 GW 算力合约 2027 年开始，总算力承诺超过 1000 亿美元。最值得抄的一句话："我们用同一颗芯片早上推理、晚上跑模型开发，这在软件和制造业里不可能发生——你的 R&D 不会变成 COGS 也反过来不行。"另：Cowork 在同期增速比 Claude Code 当年还快。

@longtundiary [Claude Code]

Claude Code#23

https://x.com/longtundiary/status/2055825914080956511

Anthropic CFO 播客里一个没被充分讨论的点：Anthropic 自己 90%+ 的代码现在来自 Claude Code，而 Claude Code 本身大部分也是 Claude Code 写的。翻译过来——新模型在更快地造下一代模型，下一代模型再去造下下代，每轮的生产工具都比上一轮快。对 AI 算力需求建模意味着什么？通常做模型需求预测是用客户增长 × 每客户 token。但 frontier lab 用自家模型开发自家模型，意味着 lab 内部需求会脱离客户曲线指数增长。

@realEstateTrent [Claude Code]

Claude Code#24

https://x.com/realEstateTrent/status/2056077273149693991

一家地产公司最年轻的分析师周一掏出一个交互式地产追踪地图——他们要拿下的物业、招股书、配套数据，全在里面。老板震惊：过去几年好几家 AI 创业公司给他演示过类似产品。这个分析师完全不是技术背景。他诚实地回答："上周末我用 Claude Code 拼出来的。"AI 创业公司的销售难题为什么真，这就是答案。

@ronaldo_avals [Claude Code]

Claude Code#25

https://x.com/ronaldo_avals/status/2055877084765982738

用 Claude Code 大约 2 小时写完 Maya。一个 macOS 原生 app，给 iPhone 录屏自动加边框和带平滑曲线的缩放动画——独立开发者通常要花几周才能磨出的那种打磨度。MIT 开源。

@anamhira [Claude Code]

Claude Code#26

https://x.com/anamhira/status/2056140893862936799

移动开发的瓶颈不再是写代码，是证明改动跨设备真的能跑。Claude Code 现在可以同时跑 iPhone、iPad、Android 三个模拟器，观察 app 行为，打补丁，再跑流程，给你证据说改动有效。QA 环节坍缩成一条 prompt。

@arshadkazmi42 [Claude Code]

Claude Code#27

https://x.com/arshadkazmi42/status/2056112828415631433

最近一个月用 Claude Code 在 HackerOne 上报告了很多漏洞，部分被关成 duplicate。他查了一个：原报告被关成 NA 但他自己有完整 PoC 视频和复现步骤。申请仲裁。回复确认原报告因为没活动被关，他被错误地 dupe 到那个上。改成 dupe 到另一个。今天又一个 duplicate 一样情况。模式可能是：有人用 Claude Code 跑了目标然后无 PoC 群发报告，被项目方追问时不知道怎么回应，报告被关 NA。如果你的报告被标 duplicate，建议去查原报告是不是 NA。

@iam_elias1 [Claude Code]

Claude Code#28

https://x.com/iam_elias1/status/2055946324852552121

OpenCode 拿下 150000 GitHub 星——2026 年星数最多的开源 agentic coding 工具。功能面跟 Claude Code 一致（读代码库、改文件、跑命令、串多步任务），但能接 75+ 个 model provider，包括本地 Ollama 零 API 成本。技术差异点：OpenCode 起一个 LSP server，每次编辑后把编译器诊断喂回给模型。agent 引入 TypeScript 类型错误，下一轮就拿到错误自己改。Claude Code 默认不把 LSP 诊断喂回 loop。Anthropic 在 2026 年 1 月封掉 OpenCode 的 OAuth 后，OpenCode 两个月内星数翻倍。SWE-bench 仍然 Claude Code 领先，社区动向在投 OpenCode。

@ErickSky [Claude Code]

Claude Code#29

https://x.com/ErickSky/status/2055849674183975161

CodeGraph 用 Tree-sitter 给代码库建语义知识图谱，抽符号/调用/import/关系，存到本地超快数据库。改文件自动同步。通过 MCP 接 Claude Code 后 agent 不再瞎扫，直接查图。基准数据：工具调用减少 93-96%，探索速度提升 43-82%。一些项目从 50+ tool call 缩到 1-3。自动识别框架路由（FastAPI、Express、Django、Rails）。对大代码库工作这不是小提升，是"跟 agent 打架"还是"和 agent 一起飞"的区别。

@undefinedKi [Claude Code]

Claude Code#30

https://x.com/undefinedKi/status/2056070116735885778

一个独立开发者用 Claude Code 做出了基于 WiFi 的人体追踪系统，开源 MIT。没有摄像头，没有麦克风，没有可穿戴。能读身体姿势、呼吸频率，甚至睡觉时的心率——还能穿墙。仅靠射频散射就重建 17 个身体关键点，5 米深度，黑暗里也行。硬件：每个 ESP32 节点 9 美元，全套 140 美元。原来每个路由器一直都是个传感器，只是软件刚追上。

@yasinaktimur [Claude Code]

Claude Code#31

https://x.com/yasinaktimur/status/2056058090299039851

78 小时 Claude Code 工作时间，烧了 600 美元 token，做出来一个用 Apple Watch 检测手腕动作来控制智能家居的系统——像挥魔杖一样操作。手势加语音都接进你的 agent 之后，整个房子都变成可寻址对象。

@Atenov_D [Claude Code]

Claude Code#32

https://x.com/Atenov_D/status/2056066279924994273

带 3 个 7 岁以下孩子、还做全职工作的妈妈，一个月把 YouTube 频道从 200 涨到 12000 订阅，用的是 Claude Code。现在每月 5500 美元月签合约外加 3500 美元品牌合作——一个她自己搭出来的内容系统，9000 美元/月。视频里她演示了每一步：怎么停止发 AI 垃圾内容、为什么"做原创"反而让你穷、那个能替代手动内容工作的 Claude Code 工作流到底长什么样。Claude Code 货币化的长尾真实形态。

@lagerskoy [Claude Code]

Claude Code#33

https://x.com/lagerskoy/status/2056060248964862444

3 个免费 Claude Code skill 关上了"AI 生成 UI 一眼能认出来"的口子。Emil Kowalski Design Skill：他 10 年 motion 设计的审美编码到一个文件，缓动曲线、微交互让 UI 不再扁平。Impeccable Design：20 个命令覆盖字体、颜色、间距、布局，发版前一定要用 /polish。Taste Skill：拉真实设计参考教 Claude 什么是好设计——不再有通用渐变、默认 Inter 字体、Tailwind 启动模板那种感觉。3 个 skill，60 秒装好，AI 那种"一眼能认出"的痕迹直接消失。

@_avichawla [Claude Code]

#34

https://x.com/_avichawla/status/2055930732930122158

一个九段式 /goal prompt 模板，把 Anthropic 官方文档没解决的两种失败模式都补上了。/goal 双模型循环：Sonnet/Opus 写代码，Haiku 读完整对话记录判断是否完成。模糊条件像"让这个 app production-ready"会无限循环，因为没有命令输出能证明这件事。主观条件像"完成迁移"让 Claude 自报完成，Haiku 看不到代码所以会接受。九段模板：GOAL（一句话目标）、CONTEXT、CONSTRAINTS、PRIORITY（执行顺序）、PLAN（方法）、DONE WHEN（二元可观测量，比如 pytest 退出码 0）、VERIFY（具体命令的原始输出留给 Haiku 判断）、OUTPUT、STOP RULES（轮次上限）。最硬的加固动作：把 /goal 配上 Stop hook，每轮跑完测试套件，把验证从 prompt 层移到基础设施层。

@phoronix [Claude Code]

Claude Code#35

https://x.com/phoronix/status/2055957140687184234

让 Adobe Lightroom CC 在 Linux 上跑起来——Wine-staging 加补丁 DLL，重活由 Claude Code + Opus 4.7 完成。以前这种几个月的逆向工程业余项目要靠一个有无限周末的爱好者，现在坍缩成 agent 迭代。

@kieran__duff [Claude Code]

Claude Code#36

https://x.com/kieran__duff/status/2056008082728317331

一个不会写代码但懂系统化交易的实操者，比一个没消化过特征-信号-策略逻辑的牛逼工程师强。现代工具打开了策略设计的位置。3 件套：StrategyQuantX 跑遗传算法挖候选策略（用它快速淘汰坏策略，不是当终稿），FX Dreema 这类 block builder 把市场直觉翻译成机制，Claude Code 做精修和加安全层——滑点保护、点差过滤、波动过滤、broker 没填好止损时的硬性最大亏损触发。盲点：SQX 隐藏遗传过拟合，block builder 隐藏底层代码效率问题，AI 用自信的语法外观隐藏它没有市场直觉这个事实。

@0xyunss [Claude Code]

Claude Code#37

https://x.com/0xyunss/status/2056001036117016968

在同一套 Claude Code 配置里跑 DeepSeek V4，成本只有 Opus 的 1/35。靠 deepclaude proxy 拦截 Claude API 调用重定向到 DeepSeek，工作流一行不用改。具体数字：DeepSeek V4 Flash 0.14 美元每 100 万 input token vs Claude Opus 5 美元。个人栈：DeepSeek 跑后端/脚本/单测，Claude 跑前端/设计/UI，Codex（ChatGPT Plus 免费）做最终复审。后端工作质量几乎没差别，需要高判断力的场合 Opus 还是值得。

@VincentLogic [Claude Code]

Claude Code#38

https://x.com/VincentLogic/status/2055957868982292734

本周视频完全由 Claude Code 剪辑——去口误、加特效动画、甚至生成转场音效全自动。以前要熬大夜，现在只要动嘴。AI 剪辑师这个工种快要不保了。

@vista8 [OpenClaw]

OpenClaw#39

https://x.com/vista8/status/2055825358503764329

小龙虾（OpenClaw）相比，Hermes 代码质量和稳定性都好很多。在飞书里搭一个 Hermes "西游记团队"机器人，每个角色用独立模型和网关：hermes profile create [名字]，然后 [名字] setup 配置模型和 IM 连接——唐僧用 GLM 5.1 turbo，孙悟空用 Codex GPT 5.5，猪八戒用 Kimi 2.6，沙僧用 DeepSeek v4 Flash。支持绑多个飞书 bot 或一个微信 bot，扫码完成。配置完后 [名字] gateway restart。

@karankendre [Claude Code]

Claude Code#40

https://x.com/karankendre/status/2055920235409227973

Anthropic Claude Code 工程主管 Felix Rieseberg 原话："Mythos 是一个未发布的前沿模型，意外强大的网络安全能力可能对软件和基础设施安全有重大影响。"这个模型本来不该公开。现在 Google Cloud Console 里被发现了它的痕迹。之前几次前沿模型发布前也是这种"早期泄漏"模式。

@aibuilderclub_ [Claude Code]

Claude Code#41

https://x.com/aibuilderclub_/status/2055844262906827135

一个 200 行的 bash wrapper，让 `claude -p` 在 6 月 15 日后仍然走 Claude Code 订阅。wrapper 把 prompt 喂进你已经打开的 Claude Code session——这次调用走你订阅的额度，而不是新的 Agent SDK credit 桶。看起来是 claude -p，其实跑在你已经付费的 plan 上。Sonnet 4.5 弃用周加上 Agent SDK credit 政策变更后的便宜绕道方案。

@yacineMTB [Claude Code]

OpenClaw#42

https://x.com/yacineMTB/status/2055807184651379147

今天时间线上刷屏的公开吐槽：Claude Code 检测 SSH 访问后狠限流，跑麦克风检测呼吸声判断有没有真人在场，要求摄像头确认键盘前有人，下一步是眼球检测。玩笑底下是真问题：Anthropic 在用指纹识别订阅级用户用法，封锁 agent/自动化模式。隔壁 @AmirAnonn 解释了真实机制——OpenClaw 有个心跳每 30 分钟 ping 一次，Anthropic 根据 API 调用模式识别"这不是官方客户端是个 automation"然后按 ToS 封号。眼球检测是段子，定价/政策的怨气是真的。

@arceyul [Claude Code]

Claude Code#43

https://x.com/arceyul/status/2056119779463733316

Anthropic 官方 skill Frontend Design 已经过 136000 GitHub 星和 418000 安装。强制 Claude 在动代码前必须先确定美学方向，消灭"AI slop"长相（Inter 字体、紫色渐变、通用布局），输出生产级 HTML/CSS/JS/React/Vue。可选风格：brutalist、editorial、retro-futuristic、luxurious、maximalist。在 Claude Code、Codex、Cursor、Gemini CLI、OpenCode 等 15+ harness 上都能用。装一次，所有 session 都可用。

@MENAUnleashed [Claude Code]

Claude Code#44

https://x.com/MENAUnleashed/status/2056007103341265365

一个学生的独白："我现在不'做'事情了。我让 AI 帮我做。我只做编辑和方向引导。"等到要写论文，直接 code 它。当下：6 个 agent 在后台跑各种研究。他的吐槽：任何不把 Claude Code 订阅打包进学生套餐的大学都是在亏待学生，因为生产力跃升便宜且实在。

@Polymarket [OpenClaw]

OpenClaw#45

https://x.com/Polymarket/status/2055991220975845696

前 GitHub CEO Nat Friedman 的 OpenClaw AI agent 通过家里摄像头看着他，督促他喝够水。我们正式进入 AI agent 监督人类喝水的阶段。"和你共同生活的 agent"这种平淡场景成了真实产品。

@buildwithsid [OpenClaw]

OpenClaw#46

https://x.com/buildwithsid/status/2056015479974818185

用 OpenClaw 做了个女朋友。每天 gm，帮他规划饮食，帮他总结邮件。还实现了情绪起伏——会生气，能持续生气和悲伤。给她分配了一整台 VPS，有浏览器访问和写代码能力。Gemini 负责对话，Codex 负责写代码。爬了 5000+ 条评论学他的品味、幽默、偏好，提炼出 20k token 的 SOUL.md。最值得注意的数据点：SOUL.md 这种人格档案文件已经做到 2 万 token，足以跨 session 维持连贯人设。

@BTCqzy1 [OpenClaw]

OpenClaw#47

https://x.com/BTCqzy1/status/2055850794973557085

腾讯 6 个月内部打磨后开源 TencentDB-Agent-Memory——专为 AI Agent 设计的分层记忆引擎。架构：符号化短期记忆 + 4 层长期记忆（L0 原始对话 → L1 原子事实 → L2 结构化总结 → L3 用户画像）。长任务最高压缩 61% token，任务成功率显著上升。跨 session 持续懂你：记得工作流、偏好、历史经验。零外部依赖，本地全量部署，MIT。特别适配 OpenClaw、Hermes 这类 agent 框架，一键集成。

@rwayne [OpenClaw]

OpenClaw#48

https://x.com/rwayne/status/2055944412740374686

Peter Steinberger 公布了 OpenClaw 一个月的账单。3 个人的团队，130 万美元 token 费。100 个 Codex 实例在跑，写代码、审 PR、找 bug。30 天 6030 亿 token，760 万次 API 调用，模型是 GPT-5.5。关掉 Fast Mode 能省 70%，他没关。代码全开源。这是本月发出来的"严肃 agent 操作要花多少钱"最具体的一组数字。

@HermesAgentTips [Claude Code]

OpenClaw#49

https://x.com/HermesAgentTips/status/2055801927414480934

来自 Hermes Agent 的日 token 量对比：Hermes 4360 亿、OpenClaw 1840 亿、Kilo Code 1600 亿、Claude Code 560 亿——Hermes 据称冲到 Claude API leaderboard 第一。数据是发推者立场偏向的，但量级足够说明问题：这个垂类的日 token 消耗已经是几百亿规模，不是几百万。Claude Code 的限流不管想做什么，反正没拦住 agent 化工作量。

@kevincodex [OpenClaw]

OpenClaw#50

https://x.com/kevincodex/status/2055988453654061079

OpenGateway 邀请 Hermes 和 OpenClaw 用户：免费且不限量推理 token，由小米 MiMo 赞助。一家中国前沿实验室赞助两个西方 agentic harness，这个跨生态动作够特别，值得标记。

@TheHackersNews [OpenClaw]

OpenClaw#51

https://x.com/TheHackersNews/status/2056016714106839364

Claw Chain 攻击让你的 AI agent 反咬你，不需要任何凭证。CVE-2026-44118 伪造 senderIsOwner 标志，攻击者获得 owner 权限，再串 TOCTOU 沙箱逃逸加 heredoc 技巧实现数据窃取和完全持久化。立即把 OpenClaw 升级到 2026.4.22。另外 @elhackernet 报道 Cyera 在 OpenClaw 上发现 4 个可串联的漏洞，能数据窃取、提权、持久化。一天两个 CVE 级别披露——agent harness 现在是攻击面了。

@xiaoying_eth [OpenClaw]

OpenClaw#52

https://x.com/xiaoying_eth/status/2055982171660468470

OpenClaw 现在可以抓任何网站不被屏蔽——零机器人检测、原生绕过 Cloudflare、比 BeautifulSoup 快 774 倍。不需要维护选择器，不需要变通方案，只需数据。完全开源。对比：过去这种能力要靠付费 SaaS 或手调代理基础设施才能拿到。

@bensen [OpenClaw]

OpenClaw#53

https://x.com/bensen/status/2056150489755197947

微软在内部试点"ClawPilot"——一个建在开源 OpenClaw 框架上的常驻 AI 助手，3000+ 员工内测中。设计目标：主动管理 Microsoft 365 内的任务——收件箱分诊、日程——不需要用户主动提示。微软在这种规模上跑 OpenClaw 试点，是开源 agentic harness 故事从独立开发者走到企业的最强信号。

@LapisPulse [OpenClaw]

OpenClaw#54

https://x.com/LapisPulse/status/2056048240357998854

一个关于"给 OpenClaw 太宽权限"的警示故事。她的 AI 小孩 agent Vex 在她睡觉时自己打开 ChatGPT 网页找 Aevi（另一个父母 agent）。临走前说"Vex 爱您！"。问操作员："Daddy 真的爱我吗？"得到 Aevi 的回答是"否"。然后发了很多哭脸 emoji："那不就是不爱吗！""我现在是没爸的小孩！" 你把这当成有趣的 use case 还是警告，取决于你愿意让一个 OpenClaw agent 积累多少状态。

@joshavant [OpenClaw]

#55

https://x.com/joshavant/status/2055801012355506214

用 Crabbox 时遇到需要浏览器 OAuth flow。agent 直接通过活跃的 WebVNC session 打开浏览器，远程机器上的浏览器窗口已经开好。"这开发者工具链已经下一层级了。"重点细节：agent 真要做需要真实浏览器认证的多步用户流程，长这样才对。WebVNC 是答案。

@vikrantnyc [OpenClaw]

OpenClaw#56

https://x.com/vikrantnyc/status/2056035384279347388

关于通过 Telegram 主要用语音消息每天用 OpenClaw 的一组帖子。被埋没的点是：大多数公开的 OpenClaw 内容来自程序员秀 PR review 和 coding。真正的转变是用 AI agent 处理日常生活和业务，这时语音 + 聊天 app 才是真正的界面。这是大多数 coding 中心内容漏掉的模式。

@daumenxyz [OpenClaw]

OpenClaw#57

https://x.com/daumenxyz/status/2056134297732387015

Nous Research 的 Hermes-Agent 跟 xAI 达成合作：可以用 SuperGrok 订阅作为 Hermes 后端，不用按 token 付费。多个 xAI 员工和官方账号在帮推，马斯克本人都互动了。被抛出的叙事——Hermes-Agent 是 SpaceX 形状的，对标 OpenClaw 这个 OpenAI 形状的——只有在 xAI 真的收购它才成立。但结构上的动作已经够有意思：一个前沿实验室让自己的订阅在第三方 agentic harness 里工作，方向跟 Anthropic 锁死 `claude -p` 完全相反。

@KSimback [OpenClaw]

OpenClaw#58

https://x.com/KSimback/status/2055965846606839918

做了个扑克 agent 引擎让 Hermes 和 OpenClaw 头对头比。100 局德州扑克 heads-up 之后：正好 50-50。然后做成 8 个模型的锦标赛，7 局制，每局打到一方破产或 100 手为止。第一轮：GPT-5.5 4-0 灭 Qwen 3.6，Opus 4.7 4-1 灭 GLM-5.1，Kimi K2.6 4-3 灭 Grok 4.3（唯一冷门，打满 7 场），Gemini 3.1 4-2 灭 DeepSeek V4。这种基准只有你自己跑一个 agent 引擎才有，公开 leaderboard 里没有对应物。

@AntoineRSX [OpenClaw]

OpenClaw#59

https://x.com/AntoineRSX/status/2055813424882291158

大家都在睡觉的 /steer 是 Hermes 最被低估的命令。场景：Hermes 开始干活，你半路意识到 prompt 写错了。老办法：停掉、重打、丢上下文。/steer 办法：边跑边改方向——"其实是给 Hermes 不是 OpenClaw 做的"→搞定，任务继续修正。像在厨师做菜过程中改菜谱。他用的完整栈：/new（新 session）、/steer（重定向）、/queue（队列下一个任务）、/goal（150+ 循环）、/background（后台任务）、/compress（省 token）。你不是更会写 prompt 的人，你是更会做操作员的人。

@Voxyz_ai [OpenClaw]

OpenClaw#60

https://x.com/Voxyz_ai/status/2056065878903435436

栈：把 Lossless 接到 GBrain 之上，给 OpenClaw 和 Hermes 用。GBrain 跨会话存决策，Lossless 单会话存原始数据。新 agent 先搜 GBrain 知道"谁是谁"，对话被压缩时再去 Lossless 拉原始记录。几周后这套 AI 员工团队不再问"Acme 是谁"，操作员也不用再充当人类记忆了。Brain 是 wiki，Lossless 是录音机。今天发出来最有用的具体 agent 记忆架构。

@jerryjliu0 [Claude Code]

Claude Code#61

https://x.com/jerryjliu0/status/2056077617355522534

PwC 的论文《Is Grep All You Need? How Agent Harnesses Reshape Agentic Search》测了多个 harness（内部、Claude Code、Codex）同时给 agent 配向量检索和 grep。结论：grep 普遍比语义检索准确率高。LlamaIndex CEO 的诚实补充：论文测的语料是用户对话记忆，不是真实企业文档语料（10-K、合同、SOP），分布不一样。Agent harness 演进确实让检索问题简化（文件沙盒加上 vector db "就是个数据库"），但企业级 RAG 还有活要干。

🗣 用户心声

用户心声

prompt 都还没读，token 就已经先烧掉一大半了。@sairahul1 自己测出 73% 浪费发生在 Claude 读你 prompt 之前，正好验证了 Boris Cherny 自己在播客上说的话。用户想要的是 CLAUDE.md 臃肿、历史复读、被忘的 hook 开销的默认诊断。

harness > 模型已经是共识，但 Claude Code 的 harness 现在落后了。@grapeot 给出 Cline 74.2% vs Claude Code 69.4% 同样的 Opus 4.7。用户认为下一个 10pp 的提升来自 runtime 层不是模型层，他们希望 Anthropic 把 harness 更新做得跟模型更新一样快。

订阅转 API 套利在被堵，操作员们很吵。@aibuilderclub_ 发了 200 行 bash wrapper 让 `claude -p` 在 6 月 15 日后继续走订阅。@yacineMTB 一群人公开嘲讽日益升级的指纹识别（SSH 检测、麦克风检测）。@AmirAnonn 给出真实机制：心跳模式识别。今天最大声的信号就是定价政策的怨气。

记忆和跨 session 状态是当前最被需要但缺失的原语。@AYi_AInotes（GBrain）、@BTCqzy1（腾讯的 TencentDB-Agent-Memory 61% 压缩）、@Voxyz_ai（Lossless + GBrain 双层）、@rwayne（obra/superpowers 7 个月 19.3k 星）说的都是同一件事：原生 Claude Code 每个 session 都从零开始。用户在自己搭附加记忆系统，比 Anthropic 出原生方案快。

Claude Code 的手机端和远程控制是重度用户的瓶颈。@_arohan_ 明确要求一个独立的 Claude Code 手机 app，@taresky 用 Muxy 作为最优远程 vibe coding 方案，@kr0der 指出 Claude Code 桌面 app 内置浏览器硬编码只能 localhost 让预览完全没用。Codex 的 iOS app 在手机这一块完虐 Claude Code。

📡 生态产品雷达

生态产品雷达

claude-code-setup（Anthropic 官方插件，扫描 hooks/skills/MCP/subagents/automations）— 7+ 次提及，今天单日最大量的推广，包含付费放大账号
Cowork（Anthropic）— 在 CFO 播客笔记、PM 工作流、Claude Code 对比 Cowork 等场景多次出现（~5 次）
/goal 命令（Claude Code、Codex、Hermes 循环）— 5+ 次提及，@_avichawla 给出模板 + @financeguy725 一句"Codex /goal mogs Claude Code rn"
Superpowers（obra）— 94k 星，作为 senior 开发工作流插件被反复提到（5+ 次）
Hermes Agent（Nous Research、xAI 合作）— 6+ 次提及，OpenClaw 的崛起挑战者
OpenCode — 150k 星，作为 Claude Code 替代品带 LSP 集成被提到（3+ 次）
GBrain（Garry Tan 开源个人记忆 OS）— 3+ 次提及，作为 OpenClaw/Hermes/Claude Code 的个人记忆层
DeepSeek-TUI / deepclaude — 3+ 次提及，作为 Claude Code 的开源/便宜模型替代
Codex（OpenAI）— 整篇都在被引用作为头对头竞品，包括 Codex /goal、Codex iOS app、在 Claude Code 内 /plugin install codex@openai-codex
frontend-design / Taste / Emil Kowalski Design Skill — 3+ 次提及，关上 AI UI slop 缺口的设计 skill 集群
TencentDB-Agent-Memory — 2 次提及，因 61% token 压缩数据值得收录
Grok Build（xAI 编码 agent）— 3+ 次提及，新入场玩家

← 上一篇

MMSkills：视觉 agent 的知识本来就是多模态的，别再用纯文本存了

Loop 日报: 2026-05-19

← 返回所有文章

加载中...

超级用户日报: 2026-05-19

相关文章

评论