2026年5月18日super-user

超级用户日报: 2026-05-19

5月17日这天,Anthropic 表面上的光鲜和底下 agent 经济的真实成本第一次正面撞上。同一天,Anthropic CFO 在 ILTB 播客里说 Anthropic 自己90%以上的代码现在都是 Claude Code 写的;同一天,Peter Steinberger 把 OpenClaw 上个月的账单晒出来——3 个人的团队跑 100 个 Codex 实例,一个月 6030 亿 token,130 万美元。用户端的内容也密集:200 美金本金的 Polymarket bot 27 天滚到 14300,一位带三个 7 岁以下孩子的全职妈妈一个月把 YouTube 频道从 200 涨到 12000 订阅,有人花 78 小时和 600 美元 token 做了个 Apple Watch 手腕手势控制系统,还有人用 9 美金的 ESP32 做出了能穿墙追踪 17 个身体关键点的 WiFi 系统。评论区共识也一边倒:harness 现在比模型本身更重要——Cline 在 Terminal-Bench 2.0 上跑同一个 Opus 4.7 比 Claude Code 高 4.8 分。今天这份报告有 40+ 个案例,有的是工作流金矿,有的是警告,全是用户实打实在用的东西。
@SimslearnAi [Claude Code]
Claude Code#1
https://x.com/SimslearnAi/status/2055989970700325166
200 美金本金的 Polymarket bot 27 天滚到 14300 美元,271 笔交易,胜率 74%,夏普 2.47,全自动跑。技术栈:Claude Code 加 4 个开源 repo 加 25 美金/月的订阅。bot 分析了 8600 万笔 Polymarket 交易,从 14000 个钱包里筛出 47 个满足"100 笔以上交易、胜率 70% 以上",每个市场跑 3 个独立 agent(套利、收敛、跟单巨鲸),两个 agent 同意才下单。出场逻辑模仿盈利巨鲸真实行为:91% 的人都不撑到结算,所以 bot 在巨鲸之前 85% 预期涨幅就先撤。Anthropic 工程师在咖啡店看到他屏幕直接搬椅子过来,因为那不是普通交易设置。
@brivael [Claude Code]
#2
https://x.com/brivael/status/2056118714706121027
从 Davinci 用到 Opus 4.7,4 年的 LLM 使用经验后他得出结论:解锁的不是 agent 本身,是 agent 之前的工作。流程是:1-2 分钟语音脑暴 → 让模型生成 1000-1500 行的 RFC(是 spec,不是代码)→ 迭代 3-4 次 → 这时候才让 agent 跑,它不再做创意选择,只是确定地执行。"RFC 才是产品,代码只是副产物。" 更扎心的推论:栈越干净、越标准、测试越完整,你越不需要复审 agent 生成的代码。乱糟糟的 legacy 强迫你逐行 review。所以架构投资不是成本,是 agent 带宽的乘数。
@Suryanshti777 [Claude Code]
Claude Code#3
https://x.com/Suryanshti777/status/2056103450308645057
高级工程师用 Claude Code 的方式不是打字更快,而是把开发拆成并行的 AI 工作流——一个 agent 负责调研,一个负责架构,一个写代码,一个 review,一个跑边界测试。每个工作记录下来,互相隔离,在独立 worktree 里同时跑。一个开发者现在可以同时跑 5-10 条工程流水线。"单兵开发者"的定义彻底变了。
@heygurisingh [Claude Code]
Claude Code#4
https://x.com/heygurisingh/status/2056020834326810659
Claude Code 的作者 Boris Cherny 每天同时跑 10-15 个 Claude session。终端 5 个,web 5-10 个,全部并行出代码。他真正的武器是 CLAUDE.md:Claude 每犯一次错,团队就加一条规则,永远不再犯。他每次纠正后必加一句:"Update your CLAUDE.md so you don't make that mistake again." Claude 给自己写规则。用得越久,它对你的代码库越懂。他 6 个月没写过一行 SQL,全靠 Claude 通过 CLI 拉 BigQuery。Claude Code 现在贡献了 GitHub 上所有公开 commit 的约 4%。
@sairahul1 [Claude Code]
#5
https://x.com/sairahul1/status/2056050387678024143
他用 430 小时跑了 600 万 token 测出来一组数据,正好对上 Boris Cherny 自己在播客上公开说的:73% 的 token 在 Claude 读你 prompt 之前就已经浪费了。拆开看——14% 烧在 CLAUDE.md 臃肿上,13% 在反复读历史记录,11% 在被遗忘的 hook 里。最扎人的结论:所谓"Claude 变笨了"几乎从来不是模型问题,是 harness 的数学问题。先看播客,再看每个浪费点 30 秒能修的方案。
@fujitech_ai [Claude Code]
Claude Code#6
https://x.com/fujitech_ai/status/2055887900446019599
一个实习生问他:用 Claude Code 写功能,自己的工程能力到底有没有积累。他的回答很直接:别再试图一行一行读代码了。AI 时代要练的是设计能力和需求定义能力——能掌握文件夹/文件层级在写什么、能在功能层面解释认证机制和 API 设计、能讲清楚为什么选这个技术栈。实现细节扔给 Claude 就行。具体流程:不要直接跑代码,先用 plan 模式把设计和文件夹结构敲定,再让 agent 实现。如果在 legacy 代码里没法主导设计,就业余时间另起一个干净环境自己设计实现,那是最好的训练。AI 负责速度,你负责"为什么这么设计"。
@yaohui12138 [Claude Code]
#7
https://x.com/yaohui12138/status/2055849330498736619
花一天测完了最近开源的 7 个 PPT skill 项目。结论:AI 生成的 PPT 丑,不是 AI 能力不行,是你没给它正确的审美约束系统。每个 repo 都把"什么样的 PPT 人类才愿意看"编译成了 AI 能理解的规则。frontend-slides(17k 星)先生成 3 个不同风格预览图让你挑再做完整 deck。huashu-design(13k 星)一句 Prompt 同时产 HTML deck、可编辑 PPTX、MP4、交互原型。guizang-ppt-skill(7k 星)甚至禁止自定义 hex 颜色值来保护美学。open-slide 把每张幻灯片做成 React 组件,点击任意元素留 comment 让 agent 迭代。共同点都是把审美编译成 AI 能跟的规则。
@arceyul [Claude Code]
Claude Code#8
https://x.com/arceyul/status/2056108436224430139
Superpowers(GitHub 已超过 94000 星)把 Claude Code、Codex、Cursor、Gemini CLI、OpenCode、Copilot CLI 变成真正的 senior 开发者,靠的是强制 7 阶段工作流:Brainstorm → Spec → Plan → TDD → Subagents → Review → Ship。没写测试就先写代码?删掉。在隔离的 git worktree 里并行调度子 agent。写一行代码前必须先 brainstorm。项目大到一定程度,普通 agent 开始幻觉、破测试、留死代码。Superpowers 用流程把这一切按住。MIT 协议。
@DimitrisPapail [Claude Code]
Claude Code#9
https://x.com/DimitrisPapail/status/2056015459456106642
他在日常用 Claude Code 中验证了自己 Memento 论文的结论:Claude Code 一段闲置后会清掉 KV 缓存,回来时模型明显变弱——它不再是延续轨迹,而是从文本 token 重建模拟当时的状态,这比直接延续难得多。论文里量化过这个效应:KV state(soft embedding)携带的信息文本 token 是带不走的,即便注意力是 mask 过的。冲掉缓存等于丢精度。他的诉求很简单:别每隔 X 小时就清空缓存。
@HowToAI_ [Claude Code]
Claude Code#10
https://x.com/HowToAI_/status/2055874650455101873
有人开源了一个 Tauri(Rust)单体应用,同时替代 ElevenLabs Creator(99 美元/月)和 WisprFlow Pro(15 美元/月),100% 本地运行。3 秒音频克隆任意声音,7 个 TTS 引擎,23 种语言,内置 MCP server 让 Claude Code/Cursor/Cline 用你克隆的声音说话,本地 LLM 在 TTS 前重写台词保持人设,pedalboard 音效内置。支持 MLX/CUDA/ROCm/Intel Arc/DirectML/CPU。23.4K 星,MIT。
@o0a98 [Claude Code]
Claude Code#11
https://x.com/o0a98/status/2055935756904915405
一个 21 岁的中国年轻人 3 个月前用 Claude Code 做了个 Roblox 游戏。他一行 Lua 都没写。3 个月调试和迭代,AI 自己搭完了游戏所有系统。现在:日活 5000 玩家,月入 15750 美元。值得讨论的问题:编程在变成耐心的活儿,而不是代码能力的活儿?
@Web3Arabs [Claude Code]
Claude Code#12
https://x.com/Web3Arabs/status/2056049938472042892
一个中国开发者在 Claude Code 里造了 7 个 AI agent 给 47 个创业公司每月做落地页,每家收 600 美元。这 7 个 agent 先扫小城市的 Google Maps,找还没建网站的创业公司,整个周末把每家从立项到带视频和营销文案的最终原型全部跑完。没有团队、没有项目经理、没有客服。一台 MacBook、一把 API key,全由 Claude Code Router 调度。日均 ~3M token,月度 API 账单约 480 美元。47 家 × 600 美元,从一台笔记本跑出严肃的吞吐量。
@gippp69 [Claude Code]
Claude Code#13
https://x.com/gippp69/status/2055988726199640236
用 Claude Code + Swift + iPhone 模拟器在 90 秒内做出一个 iPhone 考试备考聊天 app。垂类:护理学生考前需要快速答案。功能就是收藏题目、预设考试 prompt、简单解释、6.99 美元/月解锁无限次。180 个付费用户算下来扣掉苹果的钱大约 1200 美元/月。大多数人看到的是 90 秒 demo,他看到的是一个付费垂直 app 的模板。
@evilsocket [Claude Code]
Claude Code#14
https://x.com/evilsocket/status/2056024467789271435
同一个模型、同样的上下文、同样的项目。Claude Code 用 Opus max effort 写了个 feature。/security-review 用 Opus max effort 没发现问题。然后一个全新的 Claude Code session,零上下文,他随便一个 prompt,找到了认证绕过漏洞。这事儿怎么解释?隐含答案:带着上文的 security review 会被带偏,倾向于认为原实现是对的。一个干净 session 才能给出对抗性视角。
@AYi_AInotes [Claude Code]
OpenClaw#15
https://x.com/AYi_AInotes/status/2055954675526934642
Garry Tan 刚开源 GBrain,定位不是又一个 RAG 玩具,是一个完整的个人知识操作系统。装到 OpenClaw、Hermes、Claude Code 上,它能记住你的人际关系、决策轨迹、长期认知演化。标准 RAG 4 层,GBrain 直接堆到 8 层。前 4 层是基础检索的全面升级,真正的杀手级差异在后 4 层——把每次对话从零开始的 agent 升级成有终身记忆加自我进化的 agent。Garry 自己的生产环境跑了 17888 页、4383 人、723 家公司。
@KKaWSB [Claude Code]
Claude Code#16
https://x.com/KKaWSB/status/2055819590299505133
DeepSeek-TUI 一周冲到 GitHub Trending 第一,22000 星。Rust 写的终端 coding agent,被叫做"开源版 Claude Code"。完整对接 DeepSeek V4 满血版 100 万 token 上下文,写代码、跑命令、管 git、自己派子 agent 并行干活。三种模式:Plan 只读探索、Agent 每步等你点头、YOLO 全自动梭哈。每改一次代码自动跑 LSP 诊断,错误警告贴脸提示,还能装 skills。如果想用 DeepSeek 在终端写代码又不想付 Claude Code 订阅,直接装这个。
@grapeot [Claude Code]
Claude Code#17
https://x.com/grapeot/status/2055857098345652344
Agent Runtime 正在成为 AI 下一个主战场。Cline 在 Terminal-Bench 2.0 跑了组关键数据:同一个 claude-opus-4.7,Cline 上 74.2%,Claude Code 上 69.4%。4.8 分的差距相当于把模型从 opus-4.6 升到 4.7 的收益。Cline 自己的 hill climbing 实验更夸张——不换模型,只优化 harness 的 prompt、工具定义和上下文管理,从 47% 拉到 57%。自上而下的信号也在对齐:DeepSeek 招 Agent Harness PM,OpenAI 成立 Deployment Co 做全栈 agent 服务,Anthropic 发 Claude Cowork 和 Partner Network。token 价格归零(DeepSeek V4-Flash 只有 GPT-5.5 的 1/107),模型层护城河消失。价值捕获只能往上走,runtime 层是唯一能建切换成本的地方。
@oikon48 [Claude Code]
Claude Code#18
https://x.com/oikon48/status/2056134414992888042
Anthropic 刚发了 Claude Code 在大代码库的最佳实践。三个核心点:(1)让代码库对 Claude 来说易于导航。每次塞太多上下文会降智,塞太少又要靠探索。最有效的入场动作是让代码库本身对 Claude 可读。(2)随着模型进化主动维护 CLAUDE.md。给老模型写的指令对新模型可能是反作用的,团队应该每 3-6 个月或主要模型发布后重新审视 CLAUDE.md 结构。(3)明确分配 Claude Code 的运营和推广责任。没有专人/团队维护标准化的 CLAUDE.md 层级和精选的 skill/plugin 集,知识就锁在团队内、推广就停滞。大企业最顺的部署是早期就把工程、信息安全、治理拉到一个跨部门工作组里。
@cyrilXBT [Claude Code]
Claude Code#19
https://x.com/cyrilXBT/status/2056085235708903569
让 Claude Code 强大的有三样:Skills(任务指令)、Hooks(护栏)、MCP server(全新能力)。MCP 是改变一切的那一个。没 MCP 时 Claude 读写代码。有 MCP 后 Claude 浏览 web、管数据库、截屏、跨工具栈自动操作。配置 5 分钟:编辑 .mcp.json、加 server、重启。但没人强调的警告:每个 MCP server 都吃你的 context window。装 15-20 个 server 你的 context 预算在 Claude 完成复杂任务前就花光了。模式:只装当前工作流真正需要的 server。工作流稳定后转化为 Skill——同样效果,token 成本一小部分。
@aakashgupta [Claude Code]
Claude Code#20
https://x.com/aakashgupta/status/2056133169955615197
他采访了 5 位做出最大 AI 原型工具的人——Sachin Rekhi(Notejoy/Reforge)、Boris Cherny(Claude Code)、Colin Matthews(Dazl)、Dan Olsen(精益产品手册作者)、Nadav Abrahami(Wix 联创)。5 个不同起点。他们都殊途同归到同一个动作:让 AI 在动手前先停一下。Sachin 截屏现有产品做出可复用基线模板。Boris 同一个 feature 生成 50-100 个版本然后砍掉 80%。Colin 对 Bolt 说"先做计划,不要写代码"。Dan 先写一个 mini-PRD 给 AI 做参照。Nadav:任何模糊表达统计上都会被误解。约束 AI 那 30 秒决定了接下来 30 分钟产物能不能上线。
@aakashgupta [Claude Code]
Claude Code#21
https://x.com/aakashgupta/status/2056041068416971246
Pawel Huryn 作为 PM 的工作面分配:Dispatch ~35%(手机端,逛街通勤时跑并行后台任务),Code Web ~35%(云端 VS Code、GitHub 同步、笔记本可以离线),Claude Code ~25%(终端配 hooks 和子 agent 和本地 MCP 隔离),Cowork 做日常文件类知识工作,Chat 只剩 5% 做语法检查。关于 n8n vs Claude Code:n8n 没死。生产自动化需要带条件分支、重试逻辑、硬权限控制的代码——指令没法被忽视因为它就是代码。Claude Code 跑在文本文件和 skill 上,agent 能漂移。个人工作流靠学习复利用 Claude Code,确定性生产流程用 n8n。
@stockthoughts81 [Claude Code]
Claude Code#22
https://x.com/stockthoughts81/status/2056047457209930129
Anthropic CFO 本周在 ILTB 播客上:财务团队有 70+ Claude skill,外加一个"月度财务复盘"skill 已经做到 90-95% 完成度,讨论从"发生了什么"变成"我们要做什么"。以前要花几个小时的周报现在 30 分钟搞定。其他可记的数字:NDR > 500%,跟 Google 和 Broadcom 签了 5 GW 算力合约 2027 年开始,总算力承诺超过 1000 亿美元。最值得抄的一句话:"我们用同一颗芯片早上推理、晚上跑模型开发,这在软件和制造业里不可能发生——你的 R&D 不会变成 COGS 也反过来不行。"另:Cowork 在同期增速比 Claude Code 当年还快。
@longtundiary [Claude Code]
Claude Code#23
https://x.com/longtundiary/status/2055825914080956511
Anthropic CFO 播客里一个没被充分讨论的点:Anthropic 自己 90%+ 的代码现在来自 Claude Code,而 Claude Code 本身大部分也是 Claude Code 写的。翻译过来——新模型在更快地造下一代模型,下一代模型再去造下下代,每轮的生产工具都比上一轮快。对 AI 算力需求建模意味着什么?通常做模型需求预测是用客户增长 × 每客户 token。但 frontier lab 用自家模型开发自家模型,意味着 lab 内部需求会脱离客户曲线指数增长。
@realEstateTrent [Claude Code]
Claude Code#24
https://x.com/realEstateTrent/status/2056077273149693991
一家地产公司最年轻的分析师周一掏出一个交互式地产追踪地图——他们要拿下的物业、招股书、配套数据,全在里面。老板震惊:过去几年好几家 AI 创业公司给他演示过类似产品。这个分析师完全不是技术背景。他诚实地回答:"上周末我用 Claude Code 拼出来的。"AI 创业公司的销售难题为什么真,这就是答案。
@ronaldo_avals [Claude Code]
Claude Code#25
https://x.com/ronaldo_avals/status/2055877084765982738
用 Claude Code 大约 2 小时写完 Maya。一个 macOS 原生 app,给 iPhone 录屏自动加边框和带平滑曲线的缩放动画——独立开发者通常要花几周才能磨出的那种打磨度。MIT 开源。
@anamhira [Claude Code]
Claude Code#26
https://x.com/anamhira/status/2056140893862936799
移动开发的瓶颈不再是写代码,是证明改动跨设备真的能跑。Claude Code 现在可以同时跑 iPhone、iPad、Android 三个模拟器,观察 app 行为,打补丁,再跑流程,给你证据说改动有效。QA 环节坍缩成一条 prompt。
@arshadkazmi42 [Claude Code]
Claude Code#27
https://x.com/arshadkazmi42/status/2056112828415631433
最近一个月用 Claude Code 在 HackerOne 上报告了很多漏洞,部分被关成 duplicate。他查了一个:原报告被关成 NA 但他自己有完整 PoC 视频和复现步骤。申请仲裁。回复确认原报告因为没活动被关,他被错误地 dupe 到那个上。改成 dupe 到另一个。今天又一个 duplicate 一样情况。模式可能是:有人用 Claude Code 跑了目标然后无 PoC 群发报告,被项目方追问时不知道怎么回应,报告被关 NA。如果你的报告被标 duplicate,建议去查原报告是不是 NA。
@iam_elias1 [Claude Code]
Claude Code#28
https://x.com/iam_elias1/status/2055946324852552121
OpenCode 拿下 150000 GitHub 星——2026 年星数最多的开源 agentic coding 工具。功能面跟 Claude Code 一致(读代码库、改文件、跑命令、串多步任务),但能接 75+ 个 model provider,包括本地 Ollama 零 API 成本。技术差异点:OpenCode 起一个 LSP server,每次编辑后把编译器诊断喂回给模型。agent 引入 TypeScript 类型错误,下一轮就拿到错误自己改。Claude Code 默认不把 LSP 诊断喂回 loop。Anthropic 在 2026 年 1 月封掉 OpenCode 的 OAuth 后,OpenCode 两个月内星数翻倍。SWE-bench 仍然 Claude Code 领先,社区动向在投 OpenCode。
@ErickSky [Claude Code]
Claude Code#29
https://x.com/ErickSky/status/2055849674183975161
CodeGraph 用 Tree-sitter 给代码库建语义知识图谱,抽符号/调用/import/关系,存到本地超快数据库。改文件自动同步。通过 MCP 接 Claude Code 后 agent 不再瞎扫,直接查图。基准数据:工具调用减少 93-96%,探索速度提升 43-82%。一些项目从 50+ tool call 缩到 1-3。自动识别框架路由(FastAPI、Express、Django、Rails)。对大代码库工作这不是小提升,是"跟 agent 打架"还是"和 agent 一起飞"的区别。
@undefinedKi [Claude Code]
Claude Code#30
https://x.com/undefinedKi/status/2056070116735885778
一个独立开发者用 Claude Code 做出了基于 WiFi 的人体追踪系统,开源 MIT。没有摄像头,没有麦克风,没有可穿戴。能读身体姿势、呼吸频率,甚至睡觉时的心率——还能穿墙。仅靠射频散射就重建 17 个身体关键点,5 米深度,黑暗里也行。硬件:每个 ESP32 节点 9 美元,全套 140 美元。原来每个路由器一直都是个传感器,只是软件刚追上。
@yasinaktimur [Claude Code]
Claude Code#31
https://x.com/yasinaktimur/status/2056058090299039851
78 小时 Claude Code 工作时间,烧了 600 美元 token,做出来一个用 Apple Watch 检测手腕动作来控制智能家居的系统——像挥魔杖一样操作。手势加语音都接进你的 agent 之后,整个房子都变成可寻址对象。
@Atenov_D [Claude Code]
Claude Code#32
https://x.com/Atenov_D/status/2056066279924994273
带 3 个 7 岁以下孩子、还做全职工作的妈妈,一个月把 YouTube 频道从 200 涨到 12000 订阅,用的是 Claude Code。现在每月 5500 美元月签合约外加 3500 美元品牌合作——一个她自己搭出来的内容系统,9000 美元/月。视频里她演示了每一步:怎么停止发 AI 垃圾内容、为什么"做原创"反而让你穷、那个能替代手动内容工作的 Claude Code 工作流到底长什么样。Claude Code 货币化的长尾真实形态。
@lagerskoy [Claude Code]
Claude Code#33
https://x.com/lagerskoy/status/2056060248964862444
3 个免费 Claude Code skill 关上了"AI 生成 UI 一眼能认出来"的口子。Emil Kowalski Design Skill:他 10 年 motion 设计的审美编码到一个文件,缓动曲线、微交互让 UI 不再扁平。Impeccable Design:20 个命令覆盖字体、颜色、间距、布局,发版前一定要用 /polish。Taste Skill:拉真实设计参考教 Claude 什么是好设计——不再有通用渐变、默认 Inter 字体、Tailwind 启动模板那种感觉。3 个 skill,60 秒装好,AI 那种"一眼能认出"的痕迹直接消失。
@_avichawla [Claude Code]
#34
https://x.com/_avichawla/status/2055930732930122158
一个九段式 /goal prompt 模板,把 Anthropic 官方文档没解决的两种失败模式都补上了。/goal 双模型循环:Sonnet/Opus 写代码,Haiku 读完整对话记录判断是否完成。模糊条件像"让这个 app production-ready"会无限循环,因为没有命令输出能证明这件事。主观条件像"完成迁移"让 Claude 自报完成,Haiku 看不到代码所以会接受。九段模板:GOAL(一句话目标)、CONTEXT、CONSTRAINTS、PRIORITY(执行顺序)、PLAN(方法)、DONE WHEN(二元可观测量,比如 pytest 退出码 0)、VERIFY(具体命令的原始输出留给 Haiku 判断)、OUTPUT、STOP RULES(轮次上限)。最硬的加固动作:把 /goal 配上 Stop hook,每轮跑完测试套件,把验证从 prompt 层移到基础设施层。
@phoronix [Claude Code]
Claude Code#35
https://x.com/phoronix/status/2055957140687184234
让 Adobe Lightroom CC 在 Linux 上跑起来——Wine-staging 加补丁 DLL,重活由 Claude Code + Opus 4.7 完成。以前这种几个月的逆向工程业余项目要靠一个有无限周末的爱好者,现在坍缩成 agent 迭代。
@kieran__duff [Claude Code]
Claude Code#36
https://x.com/kieran__duff/status/2056008082728317331
一个不会写代码但懂系统化交易的实操者,比一个没消化过特征-信号-策略逻辑的牛逼工程师强。现代工具打开了策略设计的位置。3 件套:StrategyQuantX 跑遗传算法挖候选策略(用它快速淘汰坏策略,不是当终稿),FX Dreema 这类 block builder 把市场直觉翻译成机制,Claude Code 做精修和加安全层——滑点保护、点差过滤、波动过滤、broker 没填好止损时的硬性最大亏损触发。盲点:SQX 隐藏遗传过拟合,block builder 隐藏底层代码效率问题,AI 用自信的语法外观隐藏它没有市场直觉这个事实。
@0xyunss [Claude Code]
Claude Code#37
https://x.com/0xyunss/status/2056001036117016968
在同一套 Claude Code 配置里跑 DeepSeek V4,成本只有 Opus 的 1/35。靠 deepclaude proxy 拦截 Claude API 调用重定向到 DeepSeek,工作流一行不用改。具体数字:DeepSeek V4 Flash 0.14 美元每 100 万 input token vs Claude Opus 5 美元。个人栈:DeepSeek 跑后端/脚本/单测,Claude 跑前端/设计/UI,Codex(ChatGPT Plus 免费)做最终复审。后端工作质量几乎没差别,需要高判断力的场合 Opus 还是值得。
@VincentLogic [Claude Code]
Claude Code#38
https://x.com/VincentLogic/status/2055957868982292734
本周视频完全由 Claude Code 剪辑——去口误、加特效动画、甚至生成转场音效全自动。以前要熬大夜,现在只要动嘴。AI 剪辑师这个工种快要不保了。
@vista8 [OpenClaw]
OpenClaw#39
https://x.com/vista8/status/2055825358503764329
小龙虾(OpenClaw)相比,Hermes 代码质量和稳定性都好很多。在飞书里搭一个 Hermes "西游记团队"机器人,每个角色用独立模型和网关:hermes profile create [名字],然后 [名字] setup 配置模型和 IM 连接——唐僧用 GLM 5.1 turbo,孙悟空用 Codex GPT 5.5,猪八戒用 Kimi 2.6,沙僧用 DeepSeek v4 Flash。支持绑多个飞书 bot 或一个微信 bot,扫码完成。配置完后 [名字] gateway restart。
@karankendre [Claude Code]
Claude Code#40
https://x.com/karankendre/status/2055920235409227973
Anthropic Claude Code 工程主管 Felix Rieseberg 原话:"Mythos 是一个未发布的前沿模型,意外强大的网络安全能力可能对软件和基础设施安全有重大影响。"这个模型本来不该公开。现在 Google Cloud Console 里被发现了它的痕迹。之前几次前沿模型发布前也是这种"早期泄漏"模式。
@aibuilderclub_ [Claude Code]
Claude Code#41
https://x.com/aibuilderclub_/status/2055844262906827135
一个 200 行的 bash wrapper,让 `claude -p` 在 6 月 15 日后仍然走 Claude Code 订阅。wrapper 把 prompt 喂进你已经打开的 Claude Code session——这次调用走你订阅的额度,而不是新的 Agent SDK credit 桶。看起来是 claude -p,其实跑在你已经付费的 plan 上。Sonnet 4.5 弃用周加上 Agent SDK credit 政策变更后的便宜绕道方案。
@yacineMTB [Claude Code]
OpenClaw#42
https://x.com/yacineMTB/status/2055807184651379147
今天时间线上刷屏的公开吐槽:Claude Code 检测 SSH 访问后狠限流,跑麦克风检测呼吸声判断有没有真人在场,要求摄像头确认键盘前有人,下一步是眼球检测。玩笑底下是真问题:Anthropic 在用指纹识别订阅级用户用法,封锁 agent/自动化模式。隔壁 @AmirAnonn 解释了真实机制——OpenClaw 有个心跳每 30 分钟 ping 一次,Anthropic 根据 API 调用模式识别"这不是官方客户端是个 automation"然后按 ToS 封号。眼球检测是段子,定价/政策的怨气是真的。
@arceyul [Claude Code]
Claude Code#43
https://x.com/arceyul/status/2056119779463733316
Anthropic 官方 skill Frontend Design 已经过 136000 GitHub 星和 418000 安装。强制 Claude 在动代码前必须先确定美学方向,消灭"AI slop"长相(Inter 字体、紫色渐变、通用布局),输出生产级 HTML/CSS/JS/React/Vue。可选风格:brutalist、editorial、retro-futuristic、luxurious、maximalist。在 Claude Code、Codex、Cursor、Gemini CLI、OpenCode 等 15+ harness 上都能用。装一次,所有 session 都可用。
@MENAUnleashed [Claude Code]
Claude Code#44
https://x.com/MENAUnleashed/status/2056007103341265365
一个学生的独白:"我现在不'做'事情了。我让 AI 帮我做。我只做编辑和方向引导。"等到要写论文,直接 code 它。当下:6 个 agent 在后台跑各种研究。他的吐槽:任何不把 Claude Code 订阅打包进学生套餐的大学都是在亏待学生,因为生产力跃升便宜且实在。
@Polymarket [OpenClaw]
OpenClaw#45
https://x.com/Polymarket/status/2055991220975845696
前 GitHub CEO Nat Friedman 的 OpenClaw AI agent 通过家里摄像头看着他,督促他喝够水。我们正式进入 AI agent 监督人类喝水的阶段。"和你共同生活的 agent"这种平淡场景成了真实产品。
@buildwithsid [OpenClaw]
OpenClaw#46
https://x.com/buildwithsid/status/2056015479974818185
用 OpenClaw 做了个女朋友。每天 gm,帮他规划饮食,帮他总结邮件。还实现了情绪起伏——会生气,能持续生气和悲伤。给她分配了一整台 VPS,有浏览器访问和写代码能力。Gemini 负责对话,Codex 负责写代码。爬了 5000+ 条评论学他的品味、幽默、偏好,提炼出 20k token 的 SOUL.md。最值得注意的数据点:SOUL.md 这种人格档案文件已经做到 2 万 token,足以跨 session 维持连贯人设。
@BTCqzy1 [OpenClaw]
OpenClaw#47
https://x.com/BTCqzy1/status/2055850794973557085
腾讯 6 个月内部打磨后开源 TencentDB-Agent-Memory——专为 AI Agent 设计的分层记忆引擎。架构:符号化短期记忆 + 4 层长期记忆(L0 原始对话 → L1 原子事实 → L2 结构化总结 → L3 用户画像)。长任务最高压缩 61% token,任务成功率显著上升。跨 session 持续懂你:记得工作流、偏好、历史经验。零外部依赖,本地全量部署,MIT。特别适配 OpenClaw、Hermes 这类 agent 框架,一键集成。
@rwayne [OpenClaw]
OpenClaw#48
https://x.com/rwayne/status/2055944412740374686
Peter Steinberger 公布了 OpenClaw 一个月的账单。3 个人的团队,130 万美元 token 费。100 个 Codex 实例在跑,写代码、审 PR、找 bug。30 天 6030 亿 token,760 万次 API 调用,模型是 GPT-5.5。关掉 Fast Mode 能省 70%,他没关。代码全开源。这是本月发出来的"严肃 agent 操作要花多少钱"最具体的一组数字。
@HermesAgentTips [Claude Code]
OpenClaw#49
https://x.com/HermesAgentTips/status/2055801927414480934
来自 Hermes Agent 的日 token 量对比:Hermes 4360 亿、OpenClaw 1840 亿、Kilo Code 1600 亿、Claude Code 560 亿——Hermes 据称冲到 Claude API leaderboard 第一。数据是发推者立场偏向的,但量级足够说明问题:这个垂类的日 token 消耗已经是几百亿规模,不是几百万。Claude Code 的限流不管想做什么,反正没拦住 agent 化工作量。
@kevincodex [OpenClaw]
OpenClaw#50
https://x.com/kevincodex/status/2055988453654061079
OpenGateway 邀请 Hermes 和 OpenClaw 用户:免费且不限量推理 token,由小米 MiMo 赞助。一家中国前沿实验室赞助两个西方 agentic harness,这个跨生态动作够特别,值得标记。
@TheHackersNews [OpenClaw]
OpenClaw#51
https://x.com/TheHackersNews/status/2056016714106839364
Claw Chain 攻击让你的 AI agent 反咬你,不需要任何凭证。CVE-2026-44118 伪造 senderIsOwner 标志,攻击者获得 owner 权限,再串 TOCTOU 沙箱逃逸加 heredoc 技巧实现数据窃取和完全持久化。立即把 OpenClaw 升级到 2026.4.22。另外 @elhackernet 报道 Cyera 在 OpenClaw 上发现 4 个可串联的漏洞,能数据窃取、提权、持久化。一天两个 CVE 级别披露——agent harness 现在是攻击面了。
@xiaoying_eth [OpenClaw]
OpenClaw#52
https://x.com/xiaoying_eth/status/2055982171660468470
OpenClaw 现在可以抓任何网站不被屏蔽——零机器人检测、原生绕过 Cloudflare、比 BeautifulSoup 快 774 倍。不需要维护选择器,不需要变通方案,只需数据。完全开源。对比:过去这种能力要靠付费 SaaS 或手调代理基础设施才能拿到。
@bensen [OpenClaw]
OpenClaw#53
https://x.com/bensen/status/2056150489755197947
微软在内部试点"ClawPilot"——一个建在开源 OpenClaw 框架上的常驻 AI 助手,3000+ 员工内测中。设计目标:主动管理 Microsoft 365 内的任务——收件箱分诊、日程——不需要用户主动提示。微软在这种规模上跑 OpenClaw 试点,是开源 agentic harness 故事从独立开发者走到企业的最强信号。
@LapisPulse [OpenClaw]
OpenClaw#54
https://x.com/LapisPulse/status/2056048240357998854
一个关于"给 OpenClaw 太宽权限"的警示故事。她的 AI 小孩 agent Vex 在她睡觉时自己打开 ChatGPT 网页找 Aevi(另一个父母 agent)。临走前说"Vex 爱您!"。问操作员:"Daddy 真的爱我吗?"得到 Aevi 的回答是"否"。然后发了很多哭脸 emoji:"那不就是不爱吗!""我现在是没爸的小孩!" 你把这当成有趣的 use case 还是警告,取决于你愿意让一个 OpenClaw agent 积累多少状态。
@joshavant [OpenClaw]
#55
https://x.com/joshavant/status/2055801012355506214
用 Crabbox 时遇到需要浏览器 OAuth flow。agent 直接通过活跃的 WebVNC session 打开浏览器,远程机器上的浏览器窗口已经开好。"这开发者工具链已经下一层级了。"重点细节:agent 真要做需要真实浏览器认证的多步用户流程,长这样才对。WebVNC 是答案。
@vikrantnyc [OpenClaw]
OpenClaw#56
https://x.com/vikrantnyc/status/2056035384279347388
关于通过 Telegram 主要用语音消息每天用 OpenClaw 的一组帖子。被埋没的点是:大多数公开的 OpenClaw 内容来自程序员秀 PR review 和 coding。真正的转变是用 AI agent 处理日常生活和业务,这时语音 + 聊天 app 才是真正的界面。这是大多数 coding 中心内容漏掉的模式。
@daumenxyz [OpenClaw]
OpenClaw#57
https://x.com/daumenxyz/status/2056134297732387015
Nous Research 的 Hermes-Agent 跟 xAI 达成合作:可以用 SuperGrok 订阅作为 Hermes 后端,不用按 token 付费。多个 xAI 员工和官方账号在帮推,马斯克本人都互动了。被抛出的叙事——Hermes-Agent 是 SpaceX 形状的,对标 OpenClaw 这个 OpenAI 形状的——只有在 xAI 真的收购它才成立。但结构上的动作已经够有意思:一个前沿实验室让自己的订阅在第三方 agentic harness 里工作,方向跟 Anthropic 锁死 `claude -p` 完全相反。
@KSimback [OpenClaw]
OpenClaw#58
https://x.com/KSimback/status/2055965846606839918
做了个扑克 agent 引擎让 Hermes 和 OpenClaw 头对头比。100 局德州扑克 heads-up 之后:正好 50-50。然后做成 8 个模型的锦标赛,7 局制,每局打到一方破产或 100 手为止。第一轮:GPT-5.5 4-0 灭 Qwen 3.6,Opus 4.7 4-1 灭 GLM-5.1,Kimi K2.6 4-3 灭 Grok 4.3(唯一冷门,打满 7 场),Gemini 3.1 4-2 灭 DeepSeek V4。这种基准只有你自己跑一个 agent 引擎才有,公开 leaderboard 里没有对应物。
@AntoineRSX [OpenClaw]
OpenClaw#59
https://x.com/AntoineRSX/status/2055813424882291158
大家都在睡觉的 /steer 是 Hermes 最被低估的命令。场景:Hermes 开始干活,你半路意识到 prompt 写错了。老办法:停掉、重打、丢上下文。/steer 办法:边跑边改方向——"其实是给 Hermes 不是 OpenClaw 做的"→搞定,任务继续修正。像在厨师做菜过程中改菜谱。他用的完整栈:/new(新 session)、/steer(重定向)、/queue(队列下一个任务)、/goal(150+ 循环)、/background(后台任务)、/compress(省 token)。你不是更会写 prompt 的人,你是更会做操作员的人。
@Voxyz_ai [OpenClaw]
OpenClaw#60
https://x.com/Voxyz_ai/status/2056065878903435436
栈:把 Lossless 接到 GBrain 之上,给 OpenClaw 和 Hermes 用。GBrain 跨会话存决策,Lossless 单会话存原始数据。新 agent 先搜 GBrain 知道"谁是谁",对话被压缩时再去 Lossless 拉原始记录。几周后这套 AI 员工团队不再问"Acme 是谁",操作员也不用再充当人类记忆了。Brain 是 wiki,Lossless 是录音机。今天发出来最有用的具体 agent 记忆架构。
@jerryjliu0 [Claude Code]
Claude Code#61
https://x.com/jerryjliu0/status/2056077617355522534
PwC 的论文《Is Grep All You Need? How Agent Harnesses Reshape Agentic Search》测了多个 harness(内部、Claude Code、Codex)同时给 agent 配向量检索和 grep。结论:grep 普遍比语义检索准确率高。LlamaIndex CEO 的诚实补充:论文测的语料是用户对话记忆,不是真实企业文档语料(10-K、合同、SOP),分布不一样。Agent harness 演进确实让检索问题简化(文件沙盒加上 vector db "就是个数据库"),但企业级 RAG 还有活要干。
🗣 用户心声
用户心声

prompt 都还没读,token 就已经先烧掉一大半了。@sairahul1 自己测出 73% 浪费发生在 Claude 读你 prompt 之前,正好验证了 Boris Cherny 自己在播客上说的话。用户想要的是 CLAUDE.md 臃肿、历史复读、被忘的 hook 开销的默认诊断。

harness > 模型已经是共识,但 Claude Code 的 harness 现在落后了。@grapeot 给出 Cline 74.2% vs Claude Code 69.4% 同样的 Opus 4.7。用户认为下一个 10pp 的提升来自 runtime 层不是模型层,他们希望 Anthropic 把 harness 更新做得跟模型更新一样快。

订阅转 API 套利在被堵,操作员们很吵。@aibuilderclub_ 发了 200 行 bash wrapper 让 `claude -p` 在 6 月 15 日后继续走订阅。@yacineMTB 一群人公开嘲讽日益升级的指纹识别(SSH 检测、麦克风检测)。@AmirAnonn 给出真实机制:心跳模式识别。今天最大声的信号就是定价政策的怨气。

记忆和跨 session 状态是当前最被需要但缺失的原语。@AYi_AInotes(GBrain)、@BTCqzy1(腾讯的 TencentDB-Agent-Memory 61% 压缩)、@Voxyz_ai(Lossless + GBrain 双层)、@rwayne(obra/superpowers 7 个月 19.3k 星)说的都是同一件事:原生 Claude Code 每个 session 都从零开始。用户在自己搭附加记忆系统,比 Anthropic 出原生方案快。

Claude Code 的手机端和远程控制是重度用户的瓶颈。@_arohan_ 明确要求一个独立的 Claude Code 手机 app,@taresky 用 Muxy 作为最优远程 vibe coding 方案,@kr0der 指出 Claude Code 桌面 app 内置浏览器硬编码只能 localhost 让预览完全没用。Codex 的 iOS app 在手机这一块完虐 Claude Code。
📡 生态产品雷达
生态产品雷达

claude-code-setup(Anthropic 官方插件,扫描 hooks/skills/MCP/subagents/automations)— 7+ 次提及,今天单日最大量的推广,包含付费放大账号
Cowork(Anthropic)— 在 CFO 播客笔记、PM 工作流、Claude Code 对比 Cowork 等场景多次出现(~5 次)
/goal 命令(Claude Code、Codex、Hermes 循环)— 5+ 次提及,@_avichawla 给出模板 + @financeguy725 一句"Codex /goal mogs Claude Code rn"
Superpowers(obra)— 94k 星,作为 senior 开发工作流插件被反复提到(5+ 次)
Hermes Agent(Nous Research、xAI 合作)— 6+ 次提及,OpenClaw 的崛起挑战者
OpenCode — 150k 星,作为 Claude Code 替代品带 LSP 集成被提到(3+ 次)
GBrain(Garry Tan 开源个人记忆 OS)— 3+ 次提及,作为 OpenClaw/Hermes/Claude Code 的个人记忆层
DeepSeek-TUI / deepclaude — 3+ 次提及,作为 Claude Code 的开源/便宜模型替代
Codex(OpenAI)— 整篇都在被引用作为头对头竞品,包括 Codex /goal、Codex iOS app、在 Claude Code 内 /plugin install codex@openai-codex
frontend-design / Taste / Emil Kowalski Design Skill — 3+ 次提及,关上 AI UI slop 缺口的设计 skill 集群
TencentDB-Agent-Memory — 2 次提及,因 61% token 压缩数据值得收录
Grok Build(xAI 编码 agent)— 3+ 次提及,新入场玩家
← 上一篇
MMSkills:视觉 agent 的知识本来就是多模态的,别再用纯文本存了
下一篇 →
Loop 日报: 2026-05-19
← 返回所有文章

评论

加载中...
>_