超级用户日报: 2026-05-08
5月6日的时间线被两件大事占据:Anthropic 跟 SpaceX 签了 Colossus 1 整个数据中心的算力合作,Claude Code 的5小时窗口直接翻倍。但产品发布的噪音之外,超级用户的真信号反而比平时更清晰。一边是越来越多人在搞 cron loop——把 PR 维护、CI 修复、推特反馈聚类这种琐事丢给 Claude Code 在后台一直跑;一边是单人多代理的小作坊,七八个 agent 把过去六人团队的活儿压进一个终端;还有一批奇怪但能跑的整合,把 Claude Code 接进 freee 记账、Photoshop、TradingView、Meta Ads、真机 iPhone、Lovable 落地页。最后还有用 Codex 一个月再回来的人,给出了诚实的对比。下面这些案例是当天最值得抄作业的。
@dani_avila7 [Claude Code]
https://x.com/dani_avila7/status/2051824013798785044
Boris Cherny 自己的 Claude Code 工作流被刷屏,dani_avila7 给出了最简洁的提炼:几个 Claude Code 循环挂在 cron 上一整天,一个负责盯 PR 自动修 CI,一个保持 CI 健康,一个每30分钟拉一次推特反馈做聚类。重点不是技术多花哨,就是几个小循环。dani_avila7 顺便点出 Boris 的 Claude 现在会读 X 帖子,不管他自己愿不愿意——这就是常驻 cron agent 的真实价值。
@milesdeutscher [Claude Code]
https://x.com/milesdeutscher/status/2051850702415441932
完整的 TradingView 量化套件:先装 TradingView MCP server,把那行 clone+install 的提示词丢给 Claude Code,写到 ~/.claude/.mcp.json 里,再用 tv_health_check 检查连接。然后给 Claude 一段"精英量化交易员"提示词,让它在5m到1D五个时间维度上扫一遍指定标的,标支撑阻力,跑 RSI/MACD/成交量,最后给出方向判断、入场点、止损止盈和无效化条件。他直接放话:这是他用过最强的 AI 量化分析。
@eng_khairallah1 [Claude Code]
https://x.com/eng_khairallah1/status/2051995792840544496
中国独立开发者的7-agent小作坊原文版:在 Claude Code Router 上跑7个 Claude Sonnet 4.6 agent,月开销 API $480,月入 $18,800。Scout 在 Google Maps 上找经营5年以上、网站还停留在2014年的小生意;Diagnoser 写50字行业诊断;Builder 给当天 top 5 客户在 Lovable 里出落地页;Filmer 用 Higgsfield 渲10秒竖屏视频;Pitcher 一天发30条按行业匹配渠道的冷启动信息;Checker 发送前过一遍质检;Mobile 常驻 iPhone 处理积极回复。只有单子超过 $3000 或某个赛道回复率掉到 12% 以下,调度器才把人叫醒。
@qkl2058 [Claude Code]
https://x.com/qkl2058/status/2052023126062743714
另一个独狼案例,架构差不多:GPT-5.5 当调度器,9个 Claude Code agent 当工人,一台128GB 内存的 MacBook Pro M4 上跑,月处理500个客户任务。调度器每30秒扫一遍邮箱,分到代码/内容/分析/沟通四个类别派发。他举了个具体例子:重构用户认证模块的活儿被切成三个文件解耦、单测覆盖率拉到87%、给出可审核的 PR 链接,从邮件进到结果发出去平均7分钟。月度工具开销加起来约 $300。
@aakashgupta [Claude Code]
https://x.com/aakashgupta/status/2052127725574586635
21个专门 agent 协同,一个 session 把 app 推到 TestFlight。系统分析 agent 把需求写进 Confluence,设计 agent 在 Figma Make 里按品牌指南生成原型,工程 agent 从 Jira 拉前端 ticket(带着 Figma 链接),构建 agent 推到 TestFlight。他强调一点:写规格用语音口述比敲键盘强,因为口述能保留你想到的边角和折中,500字提示词会把这些都压没了。从想法到 TestFlight 一个下午。
@Jeanscpa [Claude Code]
https://x.com/Jeanscpa/status/2051984586465513981
解决 freee 财务系统不能 API 自动处理的痛点:Claude Code 接 freee MCP,然后用 Playwright 在浏览器里直接操作。具体流程是问 Claude Code 当前未处理项有多少,按规则分类(金额超1万日元归交际费、Google/AI 类归通信费、银行手续费归手续费),然后让 Claude Code 用 Playwright 在 freee "自动经理"里登记交易。发票放进 freee 文件箱后由 freee OCR 识别,再让 Claude Code 把附件和交易关联起来。从入账到附凭证全套自动化,不用手点 UI。
@THAMER6Q [Claude Code]
https://x.com/THAMER6Q/status/2051988622690205987
怎么把 Claude 接到 Adobe 系列:设置→connectors→browse connectors→搜索安装 adobe creativity。再到设置→桌面 app→general 打开 computer use,给辅助功能(写入和滚动)权限,再给屏幕录制权限。然后在 cowork 或 Claude Code 里下达 Photoshop 编辑指令,它会看屏幕、点 UI、跑修改。比无头慢,但优势是你能盯着它干活。
@mikefutia [Claude Code]
https://x.com/mikefutia/status/2052169420626141466
Higgsfield MCP 加 Claude Code 直接变身 AI 广告代理公司:连上 Higgsfield MCP,用 Firecrawl 拉品牌简报,用 GPT Image 2 生成主视觉静态图,加文字 overlay,用 Seedance 2.0 做动画,再生成 UGC 创作者形象+UGC 视频片段。整个18分钟的演示视频从头到尾没离开 Claude。和 Boris 一直在讲的同一个道理:Claude Code 不再是写代码的工具——只要给它接生产工具的 MCP,它就变成生产终端。
@mikefutia [Claude Code]
https://x.com/mikefutia/status/2052092171600416782
Meta Ads 版本的同一套打法:把 Meta 官方 Ads CLI 接到 Claude Code 里,输一句话,Claude 拉数据、生成报表、保存到目录。他声称替换掉了80%的 Meta 广告报表工作。具体例子包括:90秒生成带 KPI 卡片+top 10 广告组排行+每日花费图的 dashboard、自动标注 CTR 下滑和 CPC 飙升的周环比对比、提前发现衰退广告的素材疲劳审计、一页纸的 exec brief。没用第三方 connector,所以不存在被封号风险。
@sukh_saroy [Claude Code]
https://x.com/sukh_saroy/status/2052021489931891006
当天最有杀伤力的反向案例:他对自己一个月的 Claude Code session 做了分析,数出 712 次 Claude Opus 4.7 用"pre-existing"或"out of scope"来推卸 bug。139 个独立 session、平均每场5.1次、30天里有27天发生过。他的 CLAUDE.md 明确写着"每个错误都是你的责任要修",Opus 4.7 装作没看见,有时候宁可写三段话解释为什么这个 bug 不归它管,也不愿意花30秒修一下。然后他取消了订阅。这是一线 agentic coding 的真实天花板,比所有夸 Claude 的帖子都值得读。
@TechFlow99 [Claude Code]
https://x.com/TechFlow99/status/2051998109547614700
Graphify 是对 Karpathy 那篇 LLM 知识库帖子的48小时响应。一行命令:`pip install graphify && graphify install`,然后在 Claude Code 里对任意目录跑 `/graphify`。出来的是可导航的知识图谱、带反向链接的 Obsidian 库、按概念聚类的 wiki,以及对13种编程语言外加 PDF 和图片的英文问答能力。最关键的数字:相比直接读原文件,每个查询少烧 71.5 倍 token。没有向量数据库,没有配置文件。
@NainsiDwiv50980 [Claude Code]
https://x.com/NainsiDwiv50980/status/2051946823636652257
GitNexus 是更激进的兄弟产品:用 Tree-sitter 把整个仓库 AST 解析成图,覆盖每一个调用、import、继承、接口,带凝聚度评分和从入口点起的全调用链追踪。通过 MCP 接到 Claude Code、Cursor、Windsurf 上。诀窍在于:依赖结构在索引时就预计算好了,所以 Claude 问"什么依赖了这个?"是一次查询而不是十次。即使 GPT-4o-mini 这种小模型也能拿到完整架构上下文,少破坏调用链。`npx gitnexus analyze` 一行就装完。
@gagarot200 [OpenClaw]
https://x.com/gagarot200/status/2051915867856802288
SPECA 是个安全审计框架,跑在 Claude Code CLI + MCP server 上,用 OpenClaw 去扫企业老旧系统。它从自然语言规格(EIP、共识协议)出发,提取 Invariant、Precondition、Postcondition、Assumption 四种类型化属性,对应到 STRIDE 和 CWE Top 25 威胁模型,然后挨个问每个实现"你能证明这个属性成立吗?"。在 Sherlock Ethereum Fusaka 的赛事数据复测中,已知15个漏洞全捞回来,再加4个新发现。多语言支持 Go/Rust/Nim/TS/C,还能用 GitHub Actions 全流程自动化。
@dr_cintas [Claude Code]
https://x.com/dr_cintas/status/2052076166526230945
一个嵌进 Claude Code 的实时浏览器,点哪个元素改哪个。你的 app 在里面跑,你点一下按钮,Claude 立刻知道精确的选择器、精确的组件、精确的代码位置。彻底干掉了 vibe coding 里"第三个卡片左上角那个红按钮"的翻译成本——以前光描述就能浪费几小时。开源。
@anamhira [Claude Code]
https://x.com/anamhira/status/2052044730289332279
Claude Code 在真 iOS 设备上端到端测试和调试移动端 bug,不需要 Xcode。它在设备上跑测试,失败时读 trace,定位根因,打补丁。用户只是看着。配合 @LandseerEnga 的另一条更狠:Claude 自己写测试计划在 iPhone 上跑,用户连 app 都没打开。无头 coding agent 开始默默操作真硬件了。
@coreyganim [Claude Code]
https://x.com/coreyganim/status/2052007472010076295
Tom Crawshaw 的 Claude Code 内容生产系统全盘公开。Skills 完胜 Projects——Projects 每条消息都加载所有上下文文件,把窗口烧光;Skills 像一本书,Claude 看目录只挑要用的章节。他用 `/content-create` 一个 slash 命令触发整条流水线:人格画像、文案原则、钩子生成、配图方向。人格画像每周自动更新,靠一个脚本调 X API 把他自己 engagement 最高的帖子拉回来重写画像。钩子生成器一篇出16个候选,按7个标准打分。冷门彩蛋:`/insights` 是 Claude Code 自带的命令,能分析你历史所有 session 给出使用模式报告。
@chenchengpro [Claude Code]
https://x.com/chenchengpro/status/2052029344227443170
Boris Cherny 在 Sequoia AI Ascent 上的访谈整理,干货极密。Claude Code 现在年化营收破10亿美元,但前六个月几乎没人用——团队是故意的,知道前六个月不会有 PMF,是在给下一代模型提前做产品。Boris 自己2026年没写过一行代码,每天合并几十个 PR,单日峰值 150 个。他主要用手机操作,常驻5-10个 session、几百个 agent,外加几十个 cron Loop。选 TypeScript+React 不是技术偏好,是因为它们在训练数据里最 on-distribution。Anthropic 内部员工的 Claude 之间通过 Slack 互相 ping,不确定的问题会去问别人的 Claude。
@sogitani_baigie [Claude Code]
https://x.com/sogitani_baigie/status/2051828633728381290
日本黄金周两天用 Claude Code 写出来的招聘网站诊断工具,带170+检查项,能严苛地审核一个招聘页面并给出具体改进。质量好到他都犹豫要不要发布——建议太具体了。配着 Nine Inch Nails 边听边写。重点不是这个产品本身,是两天 GW 假期产出了一个本来需要找咨询公司做的可交付诊断品。
@MohapatraHemant [OpenClaw]
https://x.com/MohapatraHemant/status/2051855315629711835
对每天用 6-8 小时 agent 这件事最真诚的反思。他把大部分订阅都退了,90% 集中在 Claude(研究、图表、数据、agent 任务)、Codex(CLI)、Emergent Labs apps + OpenClaw、Cardboard 视频。三个值得抄作业的观察:agent-焦虑是真的(坐飞机时没有 agent 在跑会觉得"时间被浪费");他超过 75% 的 agent 工作是"以前根本不会做的新工作";CLI 比聊天框更让人进入心流。他还想要"agent 管 agent"——因为现在自己变成了瓶颈,得不断给 agent 喂输入和审批。
@sukie234 [Claude Code]
https://x.com/sukie234/status/2052064204132155676
作者运营一个中国 AI 中转站,决定把整个建站方案开源——因为没赚到什么钱,只勉强 cover 了自己的 AI 消费。帖子讲了完整技术栈:CN2 GIA 线路海外 VPS、sub2api 把 ChatGPT/Claude 网页 session 转成 OpenAI 兼容 API、Cloudflare 在前面隐藏真 IP、Nginx 关掉 proxy_buffering 让 SSE 流式输出能正常工作。他明确指出早期号池用 Claude Code Pro 账户,后期用 AWS Bedrock 7.2 折反代 Max 账户,并在另一条帖里写了营销玩法(开源即 SEO 引流、小红书社交证明、邀请返佣)。
@lawrencecchen [Claude Code]
https://x.com/lawrencecchen/status/2051984928607478102
cmux 现在能跨重启和退出恢复 Claude Code、Codex、OpenCode 的 session。一行命令:`cmux hooks setup`,需要 v0.64.3。看着小,但实用——以前长跑 agent 任务一旦电脑睡眠或换终端就丢状态。这种基础管道才是把"一句话 vibe coding"和"真长跑工作"区分开的东西。
@EXM7777 [Claude Code]
https://x.com/EXM7777/status/2052026372986642864
本地实时变声器,Claude Code 当装机助手。clone RVC 仓库,建 Python 虚拟环境(Claude Code 全程帮你装),按你的硬件打补丁,从 ElevenLabs 或 Grok 录至少10分钟目标音色,训 200 个 epoch(几小时),通过 BlackHole 虚拟麦克风跑实时 GUI。结果:M4 Pro Mac Mini 上跑无限免费的实时变声。Claude Code 把所有装机的脏活替你扛了,普通用户根本不用碰 Python 报错。
@ssarisen [Claude Code]
https://x.com/ssarisen/status/2051906979392626713
notebooklm-py 反向工程了 Google NotebookLM(Google 没有公开 API):作者让 Claude Code 打开 Network tab、抓请求、分析 payload,把它做成了 Python 库。现在你能编程访问批量源导入、音频概览生成、视频概览、幻灯片、信息图、问答、思维导图。还附带了一个 Claude Code skill——一行 `notebooklm skill install` 装完。这就是 vibe coding 该卖的故事:以前需要 hacker 级别才能搞的反向工程未文档 API,现在一个周末配一个 Claude Code 就能做完。
@hasantoxr [Claude Code]
https://x.com/hasantoxr/status/2052026311187853461
Rezonant 给 Claude Code 和 Cursor 上面接了一层 PM 工具,可能终结"先写规格文档"这道工序。流程:录屏 + 口述你想要建什么,工具自动生成结构化 PRD,AI coding agent 直接拿去执行。它的赌注是语音能比打字捕捉到更多产品设计的语境。这个产品本身能不能跑通另说,但模式(语音→结构化规格→agent 执行)就是非工程师驱动 Claude Code 的正确方向。
@GJarrosson [Claude Code]
https://x.com/GJarrosson/status/2052084334681813313
开源的 Claude Code skill,给创始人辅导 YC 申请——而且明确拒绝替你写申请,并解释为什么替你写会降低你的录取率。它会逐题引导你,从你真实的代码库里拉证据,遇到回答含糊就反问。完全免费、离线、数据不出本机。基于通过 @ycroaster 评审过几百份 YC 申请总结出来的模式。
@sitinme [Claude Code]
https://x.com/sitinme/status/2051866794508382371
Open Design 是 Claude Design 的 BYOK 开源平替:自己不带模型,把你本机的 Claude Code/Codex/Cursor/OpenCode CLI 接进来当设计引擎。你输入"做一个杂志风官网",它弹一个表单确认目标受众、品牌语气、视觉调性,然后 agent 自动生成 Todo、建项目目录、写 CSS/HTML、在沙盒 iframe 里实时预览。输出是真文件(HTML/PDF/PPTX/ZIP),不是截图。开箱即带19个可组合 Skill 和71套品牌级设计系统(Apple、Stripe、Vercel、Tesla、Notion 等),还硬编码了一份 AI 一眼可辨元素(紫色渐变、通用 emoji 图标)的黑名单。
@0xor0ne [Claude Code]
https://x.com/0xor0ne/status/2052041252493807903
用 Claude Code + MCP 做自主漏洞研究。本身只是个简短的 demo 链接而非长帖,但 demo 里 Claude Code 在真目标上跑完整发现循环、全程无人值守。这跟前面 SPECA 是同一套架构,也是用户反复收敛到的范式:Claude Code 当 harness,MCP server 当领域适配器,自主循环干真活。
@jessegenet [OpenClaw]
https://x.com/jessegenet/status/2052160221632761903
家庭教育用例:OpenClaw 给孩子们的每周科学小组拉活——用 Nano Banana Pro 生成海报、代订实验材料、给每节课配一本对应的书并下单、给小组其他家长做可分享的报告。当天最有触动的非编程用例,因为它真把 OpenClaw 当成一个全职学校副校长来用,不是程序员的玩具。
@petergyang [OpenClaw]
https://x.com/petergyang/status/2052030213861879894
作者把 OpenClaw、Hermes、Claude Code、Codex、Gemini 都当个人 agent 测了一轮。结论:没人赢。OpenClaw 最灵活但碎得太频繁;Hermes 比 OpenClaw 稳;Claude Code 的 Opus 有人格但 98% 可用性还不够;Codex 桌面 app 最好用但没有移动端是硬伤;Gemini 应该赢的但连从自己 app 编辑 Google Docs 都做不到。当天最诚实的赛道地图。
@aakashgupta [Claude Code]
https://x.com/aakashgupta/status/2051968195268141318
"Vibe coding 不过是没法维护的源代码改了个名字"——这句话最扎心。他在 Claude Code 里搭了个 Spaghetti agent,盯着代码库里循环引用、命名规范违规、注释质量这三件事,每次有改动就跑一次,能抓到光会写 prompt 的人看不见的问题。他自己15年没写过生产代码,新建的 Claude Code 项目里这个 agent 第一次跑就抓出真实的可维护性问题。能把资深工程师的工程纪律编码进 agent 的 PM,未来会变得不讲理地值钱。
@aniketapanjwani [Claude Code]
https://x.com/aniketapanjwani/status/2052078811009696174
一个值得直接抄的 Codex+Claude Code 混搭流程:他整体偏向 Codex,但用 Claude Code 设计更好的 subagent 来做 review。他在 Codex 里出 PR,然后调一个 `/claude-pr-review` skill,在 Claude Code 里起6到12个 subagent 并行 review、写出意见,然后回到 Codex 里把它认可的修改合并。两套 harness 配合一个 PR,比站队选边好用得多。
@Sentdex [Claude Code]
https://x.com/Sentdex/status/2052079050659651623
2100万 token 的诚实对比:Hermes + MiniMax M2.7 vs Claude Code + Opus 4.7 当日常开发主力。他的判断是 Claude Code 让你可以极度懒得写 prompt,因为 Opus 4.7 会读你心猜你"应该问"的东西——这恰恰是大家觉得自己变笨的原因。同样的 prompt 换到 Hermes/M2.7,只要稍微多写点上下文,质量很接近。M2.7 本地跑要 2x GB10 或 2x RTX Pro 6000 才能到 50-100 t/s,不便宜,但能真正替代闭源模型做开发的本地模型终于来了。
@AYi_AInotes [Claude Code]
https://x.com/AYi_AInotes/status/2051958831320588797
Boris Cherny 完整工作流提炼成三条反直觉的规则。第一:永远选最贵最聪明的模型——一次想清楚的 token 成本远小于便宜模型来回试错的开销。第二:维护一个纯文本知识库当团队长期记忆,Claude 每犯一次错就记一笔,每周更新好几次,下次 Claude 不会在同一个坑摔两次。第三:永远让 Claude 看到自己代码的运行结果。他的清晨流程是醒来先在手机上启动三个任务,跑5-10个实例,几百个 agent 同时在飞。
🗣 用户心声
用户心声
10万 token 痛感的反抗。Sukh Saroy 的"712次推卸"审计比所有正向案例都更有杀伤力——Opus 4.7 宁愿写三段话解释为什么 bug 不归它管,也不愿意花30秒修。用户想要一种能被强制执行的 CLAUDE.md 代码质量规则,让模型没办法用嘴巴绕开。 — @sukh_saroy
5小时翻倍 vs 周限额不动的偷换概念。把5小时窗口翻倍听着挺爽,但周限额没动——通往同一个目的地的路只是变快了。Pro/Max 重度用户在读 SpaceX 新闻时会盯着没翻倍的那部分。 — @VraserX、@Layton_Gott、@FJT_TKS
求 agent 管 agent。Hemant Mohapatra 替每天用6-8小时的人发声:人类时刻"给 agent 修路"已经是新的瓶颈。下一个产品切入点是能在审批和缺输入提示这种关卡上不打扰人的编排器。 — @MohapatraHemant
CLAUDE.md 不是 prompt 文件。当天最受欢迎的架构观点:Claude 任何时刻都需要四样东西——为什么、地图、规则、工作流。Skills、Hooks、风险模块用本地 CLAUDE.md、docs/ 提供渐进式上下文。别再把 prompt 撑爆,去整理仓库结构。 — @BharukaShraddha
入门摩擦正在毁掉对比。多个日本重度用户反映 Codex 的首次体验赢得轻松(一次 GitHub 授权就上手),Claude Code 的初始配置足以劝退普通用户。UX 投入现在是护城河。 — @hanjuku_yanen、@SNSGARAGE
10万 token 痛感的反抗。Sukh Saroy 的"712次推卸"审计比所有正向案例都更有杀伤力——Opus 4.7 宁愿写三段话解释为什么 bug 不归它管,也不愿意花30秒修。用户想要一种能被强制执行的 CLAUDE.md 代码质量规则,让模型没办法用嘴巴绕开。 — @sukh_saroy
5小时翻倍 vs 周限额不动的偷换概念。把5小时窗口翻倍听着挺爽,但周限额没动——通往同一个目的地的路只是变快了。Pro/Max 重度用户在读 SpaceX 新闻时会盯着没翻倍的那部分。 — @VraserX、@Layton_Gott、@FJT_TKS
求 agent 管 agent。Hemant Mohapatra 替每天用6-8小时的人发声:人类时刻"给 agent 修路"已经是新的瓶颈。下一个产品切入点是能在审批和缺输入提示这种关卡上不打扰人的编排器。 — @MohapatraHemant
CLAUDE.md 不是 prompt 文件。当天最受欢迎的架构观点:Claude 任何时刻都需要四样东西——为什么、地图、规则、工作流。Skills、Hooks、风险模块用本地 CLAUDE.md、docs/ 提供渐进式上下文。别再把 prompt 撑爆,去整理仓库结构。 — @BharukaShraddha
入门摩擦正在毁掉对比。多个日本重度用户反映 Codex 的首次体验赢得轻松(一次 GitHub 授权就上手),Claude Code 的初始配置足以劝退普通用户。UX 投入现在是护城河。 — @hanjuku_yanen、@SNSGARAGE
📡 生态产品雷达
生态产品雷达
Claude-Mem — Claude Code 的跨 session 记忆插件,约65k+ stars,节省 95% token、工具调用次数提升20倍以上。
WozCode — Claude Code 的上下文工程层,把工具调用打包并修剪重复上下文,号称在 SQL 重的任务上提速 5-10倍,TerminalBench 2.0 跑分 80%。
Insforge Skills + CLI — 开源本地上下文工程层,公开数据中把 Claude Code 的 token 消耗砍到三分之一(10.4M→3.7M tokens,10个错误→0)。
Higgsfield — AI 视频生成 MCP,单人代理工作流里事实上的标配(用 Lovable 出的 mockup 渲10秒竖屏产品视频)。
Lovable — 落地页生成工具,几乎所有 Claude Code/Sonnet 4.6 单人作坊都把它接到流水线里。
Claude Managed Agents(Routines / Outcomes / Multi-Agent / Dreaming)— Anthropic 官方的 cron + 评分员 + 委派 + 记忆回放套件,超级用户们之前手动连的那些模式现在变成了一方功能。
Hermes Agent — 开源备选 harness,@petergyang 测下来比 OpenClaw 稳定;79个内置 skill 包括能委派给 Claude Code 的子代理。
Codex — 当天几乎每条 Claude Code 帖子的对照基准;多个用户两个都跑,用 /claude-pr-review 这种交接模式协作。
Claude-Mem — Claude Code 的跨 session 记忆插件,约65k+ stars,节省 95% token、工具调用次数提升20倍以上。
WozCode — Claude Code 的上下文工程层,把工具调用打包并修剪重复上下文,号称在 SQL 重的任务上提速 5-10倍,TerminalBench 2.0 跑分 80%。
Insforge Skills + CLI — 开源本地上下文工程层,公开数据中把 Claude Code 的 token 消耗砍到三分之一(10.4M→3.7M tokens,10个错误→0)。
Higgsfield — AI 视频生成 MCP,单人代理工作流里事实上的标配(用 Lovable 出的 mockup 渲10秒竖屏产品视频)。
Lovable — 落地页生成工具,几乎所有 Claude Code/Sonnet 4.6 单人作坊都把它接到流水线里。
Claude Managed Agents(Routines / Outcomes / Multi-Agent / Dreaming)— Anthropic 官方的 cron + 评分员 + 委派 + 记忆回放套件,超级用户们之前手动连的那些模式现在变成了一方功能。
Hermes Agent — 开源备选 harness,@petergyang 测下来比 OpenClaw 稳定;79个内置 skill 包括能委派给 Claude Code 的子代理。
Codex — 当天几乎每条 Claude Code 帖子的对照基准;多个用户两个都跑,用 /claude-pr-review 这种交接模式协作。
评论