2026年6月10日super-user

超级用户日报: 2026-06-11

Fable 5 在这个周期中段落地,效果立竿见影:最有意思的帖子已经不再讨论 prompt,而是讨论 loop、验证器、以及一个 agent 无人看管跑 48 小时会发生什么。第二条主线是 Claude Code 正在彻底逃离终端——Meta 广告、冷邮件、报税、学术写作、Blender 动画,甚至还有跑在 OpenClaw 上的机器人小车。而在这一切之下,整个社区都在计算同一道数学题:6 月 22 日补贴 token 时代结束之后怎么办。
@cyntro_py [Claude Code]
Claude Code#1
https://x.com/cyntro_py/status/2064389314910552442
他把能找到的公开 Claude Code dynamic workflow 全爬了一遍:500 多个仓库里的 1245 个脚本,然后做了排名和分类。产出是一张超级用户如何编排 agent 舰队的实证地图,浓缩成 10 个高频模式:结构化输出、并行扇出、多阶段、流水线、预算感知、嵌套 workflow、对抗性验证、评审团、调度者-工人、循环到收敛。结构化输出几乎人人在用,因为有校验的 JSON 才能让编排器基于真实数据做分支、让任务可恢复。对抗性验证和评审团是手艺所在——先派几个唱反调的 agent 试图推翻结论,扛得住才算数。
@IngenieroSeed [Claude Code]
Claude Code#2
https://x.com/IngenieroSeed/status/2064357933614240246
他在 90 美元每月的 Max 5x 套餐上,开了三个 Claude Code 会话同时跑 ultracode 模式,/goal 全程激活、权限拉满,连续跑了整整 48 小时。零崩溃、零卡死、全程在线——最后是因为实验该结束了才手动关掉,不是因为出了任何问题。这是「自主连续运行到底能跑多远」的一个硬数据点。
@theo [Claude Code]
Claude Code#3
https://x.com/theo/status/2064214943210324243
重新订阅 200 美元的 Claude Code 才 10 天,ccusage 显示他已经烧掉了价值 1100 多美元的推理量。最有意思的是:这些钱大部分不是花在写代码上,而是花在审计 GPT 5.5 干的活上。token 成了规模化的第二意见。
@qkl2058 [Claude Code]
Claude Code#4
https://x.com/qkl2058/status/2064368318119883057
一个 16 岁少年靠星链信标定位设备赚了约 30 万美元的故事。硬件是 35 美元的 RTL-SDR 接收器、小型 Ku 波段天线锅、LNB 加树莓派 5,物料成本约 180 美元。Claude Code 负责写 Python:抓星链信标信号、用公开的 TLE 轨道数据识别卫星、靠三颗卫星的多普勒频移做三角定位,精度 10 到 30 米,不依赖 GPS、手机信号和互联网。他 3D 打印了外壳,以 899 美元一台卖了 350 台,客户是徒步者、船员和野火应急队。接收公开广播信标是合法的——律师提前确认过。
@humzaakhalid [Claude Code]
OpenClaw#5
https://x.com/humzaakhalid/status/2064334184680943678
本周刷屏的本地部署账本:一位开发者 10 天烧出 170 美元的 Claude Code 账单后,用一台 599 美元的 Mac mini M4 跑 ollama 替代了云端开销。技术栈:Claude Code 指向 localhost,qwen 3.6 14b 写代码,deepseek r1 14b 做推理,gemma 4 4b 干杂活,外加一个跑在 Telegram 上的 openclaw 守护进程。他算的账是每月 3 美元电费对比每月 459 美元订阅费——第一年省 5232 美元,且数据不出本机。这个故事本周被至少五六个账号轮番转述,足以说明成本焦虑咬得有多狠。
@Ubermenscchh [Claude Code]
Claude Code#6
https://x.com/Ubermenscchh/status/2064367246173217199
丹麦地球物理学博士 Mads Lorentzen 把自己的求职申请机器整套开源了,基于 Claude Code,MIT 协议。fork 仓库、填一次个人背景,之后每个职位自动跑五步流水线:给岗位匹配度打分、挑选相关经历生成定制 LaTeX 简历、写求职信、由第二个 agent 对抗性审稿并强制修改、最后编译成可直接投递的 PDF。所有环节都是可读可改的纯 markdown。489 星、270 fork——这个 fork 比例说明大家是真在用,不是收藏夹吃灰。
@madebydia [Claude Code]
OpenClaw#7
https://x.com/madebydia/status/2064325718385787389
一位全职在家带娃的家长把 Claude Remote Control、OpenClaw、Hermes 和 Codex 全试了一遍,最后落在一套经得起带娃现实考验的手机优先方案上:iPhone 上的 Codex app 远程驱动 MacBook 跑长任务,发条 10 到 20 秒的消息就能开工;日常琐事走 iMessage 上的 Hermes——对着手表说 3 秒钟就能记饮食、记待办,连手机都不用掏。这是用一个真实指标——「带娃时还能不能用」——对四套 agent 方案做的诚实横评。
@aniketapanjwani [Claude Code]
Claude Code#8
https://x.com/aniketapanjwani/status/2064454133185180061
给有 Claude Code 订阅的学者的玩法:把自己过往的论文分别喂给 Fable 和 Opus,让它们各自蒸馏出一个「你的文风」skill。然后在新论文上,让 Opus 在两个独立线程里分别套用这两个 skill,对比哪个模型更抓得住你的声音。他提醒 Fable 只included到 6 月 23 日,所以做这种对比实验、以及沉淀那些访问权结束后还能留下的流程改进,窗口期就是现在。
@QingQ77 [Claude Code]
Claude Code#9
https://x.com/QingQ77/status/2064297705099169886
面向中文科研工作者的一体化学术技能包,在 Claude Code 和 Codex 上直接可用。三个可串联的 skill:research-writing-skill 负责写论文、改稿和回复审稿人,默认中文;office-academic-skill 负责文献汇报、组会 PPT 和答辩 PPT,输出可编辑文件;scientific-toolkit-skill 包装了 MATLAB/Python 计算、论文图表和文献检索,面向光电方向。先算数据出图、再写论文、最后做答辩 PPT——一条流水线跑完。
@Seannywilson [Claude Code]
Claude Code#10
https://x.com/Seannywilson/status/2064422934215643156
一次完全在 Claude Code 里跑完的 30 分钟 GTM 冲刺:用 DiscoLike 把整个目标市场映射、筛选、打分,用 Prospeo、AI Ark、BlitzAPI 找人,用 PredictLeads 按在招职位过滤,用 Icypeas、BetterContact、LeadMagic 补全数据,再叠加 Exa 和 Parallel 做深度调研(公告、融资、新员工动向),基于全部数据写文案,最后推送到 Instantly。过去要在 Clay 里耗几天的活,压缩到几分钟——销售运营变成了一个工具调用问题。
@mikefutia [Claude Code]
Claude Code#11
https://x.com/mikefutia/status/2064446547505602605
一个用五个 skill 跑完整套 Meta 广告流程的 Claude Code 插件:/spy 抓取竞品所有在投广告,按投放时长排序(逻辑是活得久等于被验证过);/competitors-extractor 把 3 到 5 个品牌正面对比,找出没人用的角度;/bulk-creative 基于胜出角度批量生成 20 条品牌调性文案;/ad-score 在花钱之前按六个维度给每条广告打 0 到 100 分;/ad-matter 通过 Meta 官方 MCP 审计在投账户,输出按优先级排序的修复清单。他的卖点是替代每月 300 美元的间谍工具和一部分代理公司的活。
@coldemailchris [Claude Code]
Claude Code#12
https://x.com/coldemailchris/status/2064377093618565469
一套跑在 Claude Code、Clay 和 n8n 上的全自动冷邮件系统,按 skill 逐个拆解:GTM 战役论点生成器、带真实案例的 TAM 映射、自动挑选最佳数据源的客户开发 agent、联系人数据补全流、随时间迭代文案的消息 skill、专抓正在投广告和正在招人的公司的爬虫、按意向和价值给线索打分的回复管理 agent、对高价值回复做电话号码补全、以及实时撰写定制回复的草稿 agent。整个营收前台被拆成了一摞 agent。
@dvassallo [OpenClaw]
OpenClaw#13
https://x.com/dvassallo/status/2064476197241946113
他用 openclaw 加 TurboTax 报完了 2025 年的税——也撞上了当今 agent 的真实天花板。数字 agent 都算对了,但报税网站表单的复杂度让 Opus 和 GPT 双双折戟,最后他只能手动把 agent 算好的数字一个个填进去。一个精确而不性感的数据点:卡住正经非编码工作的不是推理能力,是对 agent 不友好的网页 UI。
@Hexblade_eth [OpenClaw]
OpenClaw#14
https://x.com/Hexblade_eth/status/2064370605521256507
对 WorkClaw(面向团队的 OpenClaw 衍生品)的实测结论:他上周「入职」了一个,在 Slack 里跑运营,确实交付了真活——日历分诊、供应商邮件、浏览器取数、Notion 更新,全在它自带 3000 个集成的 ClawOS 云电脑里完成。他也给出了公允的质疑:云端自主权是安全隐患,相比本地 OpenClaw 有锁定风险。他的判断:配合 SkillSpector、任务流状态和严格的管理员控制,它跨过了「能用」这条线——像雇了个永不睡觉的实习生。
@dfect [OpenClaw]
OpenClaw#15
https://x.com/dfect/status/2064352062737916388
他让 AI 替他买了电影票:把指令交给自己的 agent——Claude Code、Codex 或 OpenClaw 哪个都行——agent 自己生成了一个稳定币钱包、完成支付,然后返回两个可在 Cinepolis 兑换的取票码。agent 对 agent 的商业交易发生在现实生活里,不是白皮书里。
@kleffew94 [Claude Code]
Claude Code#16
https://x.com/kleffew94/status/2064398174677258347
一场 x402 付费工具调用的现场演示,搭档是 Solana 和 Coinbase AWAL:Claude Code 检索纽约尼克斯队的最新社交与新闻语境,整理成 brief,再用 StableStudio 生成视频——在请求时发现付费工具、把多个工具捆进一个 workflow、并对每次调用的边际成本做推理。最有意思的框架是:同一个运行时里,workflow 既能花钱也能赚钱。
@akira_papa_IT [Claude Code]
Claude Code#17
https://x.com/akira_papa_IT/status/2064384668804461008
Claude Code 通过 MCP 全自动操作 Blender,做出一支 3D 俯卧撑健身视频,全程零手工:把棒人间修正成正确的 IK 关节运动、通过 API 拉取 Mixamo 角色、搭出健身房场景、调好自然光照、循环俯卧撑动作,再用 EEVEE 以每帧 0.2 秒的速度直接渲染成 MP4。一切靠聊天指令完成——没有 3D 美术也能跑通健身、体育内容流水线的雏形。
@Timmysofine [Claude Code]
Claude Code#18
https://x.com/Timmysofine/status/2064437810317394062
他上传了一段自己的视频,通过 Claude Code 跑 Pika MCP 上的 Language Swap Skill,然后看着自己说出一口流利的芬兰语——克隆音色、口型精准,逼真到他自己回看了两遍。配置就三步:添加 Pika MCP 服务器并在 Claude Code 里完成认证,用 npx 装配套 skill,上传视频、说出目标语言。创作者的本地化工作正在坍缩成一次 skill 调用。
@xiaohu [Claude Code]
Claude Code#19
https://x.com/xiaohu/status/2064190407198875730
装上他那套工具链之后,Claude Code 或 Codex 直接变身视频剪辑师:他让 AI 翻译一段 WWDC 2026 的视频,并按内容分析自动把视频精准裁切成多个独立片段。一句聊天指令,就能做基于内容理解的自动剪辑。
@murasametech [OpenClaw]
OpenClaw#20
https://x.com/murasametech/status/2064182166016467284
OpenClaw 控制实体机器人小车:一台跑在树莓派上的 Stack-chan 小车,现在已经能避开人自由行驶。路线图上的下一个里程碑:目标物扫描——具体来说,是找到一只卡比兽毛绒玩具。小而可爱,但证明了 agent harness 可以泛化到具身硬件上。
@davis7 [Claude Code]
Claude Code#21
https://x.com/davis7/status/2064457646653215094
一线开发者的 Fable 第一天:Effect v4 代码片段的质量开箱即扎实,跨 convex、cloudflare、depot、clerk 的部署任务也不用人扶着走。他还顺手给 Claude Code 本体正名——workflow、auto mode、研究型子 agent 都很好用。最妙的细节:auto mode 下模型发现自己被权限检查拦住了,主动让他回复一句明确批准好让检查放行。最大的槽点:速度和价格——哪怕开低推理档,推个简单改动也要好几分钟。
@_xjdr [Claude Code]
Claude Code#22
https://x.com/_xjdr/status/2064465305917935654
一位严谨怀疑派的评测:他从一月起就没碰过 Anthropic 的模型,这次把 Fable 扔进自己的 benchmark 和最难啃的几个仓库里跑。结论:相比 Opus 是巨大进步,尤其擅长大型多模块 review——抓出了好几个真正隐蔽的 bug——和长链路多步骤任务。但就他的场景而言,仍不及 GPT 5.5 xhigh,刨去 Claude Code 新特性后跟他自己微调的 K2.6 基本打平。他打算再用一天确认,然后回到 80/20 的老配比。这是发布日最有公信力的一份偏负面评测。
@Steve8708 [Claude Code]
Claude Code#23
https://x.com/Steve8708/status/2064369026030277013
重度双开几周后的体感记分卡:Codex 配 GPT 5.5 快得多、便宜得多、更少撞限额、指令遵循更好、更不需要看管;Claude Code 配 Opus 4.8 赢在 dynamic workflow、子 agent 调度和方案生成,但慢得痛苦、限额吃得凶。他最终的工作流:默认 Codex,遇到大难题、需要 dynamic workflow 或者要生成方案再交给 Codex 实现时才换 Claude Code。这才是最有用的对比姿势:不问谁更强,问同一个厨房里谁切菜谁掌勺。
@irl_danB [Claude Code]
#24
https://x.com/irl_danB/status/2064184976556572901
Dynamic workflow 的 JS 环境在技术上禁止递归,于是他花了一个周末照样把递归 workflow 做了出来——用的是 trampolining(蹦床技法):外层事件循环把内层 agent 调用当成虚拟递归栈来管理。这正是他当年把 Claude 深度只有 1 的子 agent 架构硬撑成深层嵌套结构的同一招,源头是 Spring 时代的 Java 接线手艺。他承认共享状态有坑,但没有一个是没解过的。超级用户从不等功能上线,他们直接用计算机科学把功能造出来。
@alphabatcher [Claude Code]
#25
https://x.com/alphabatcher/status/2064441748974383439
一份可以直接抄的 5 天计划,把你从写 prompt 带到 Boris Cherny 式的写 loop。第 1 天:用 CLAUDE.md 建仓库记忆,加上允许执行的 shell 命令清单。第 2 天:给 Claude 最常搞坏的那个流程写一个验证 skill,返回通过与否加日志。第 3 天:三个命令——babysit 盯 PR 和 CI、triage-issues 分诊 issue、deploy-watch 盯线上。第 4 天:用 /loop 以 5 到 15 分钟的间隔把它们跑起来。第 5 天:过夜定时任务把报告写进收件箱文件夹,早晨的 loop 负责读。铁律:每个写代码的 loop 必须配一个独立的验证者,否则你醒来会看到 14 个坏掉的 PR,每个都配着信心十足的总结。
@manishamishra24 [Claude Code]
Claude Code#26
https://x.com/manishamishra24/status/2064291199280886026
Affaan Mustafa 用 Claude Code 在 8 小时内搭出一个完整 startup,拿下 Anthropic x Forum Ventures 黑客松冠军——然后把全套配置开源成了 Everything Claude Code(仓库 affaan-m/ecc,MIT 协议)。这是十个月日常使用打磨出来的系统:庞大的 skill 库加几十个专职子 agent——OWASP 安全审查、防止 Claude 三小时后忘记此前决策的记忆优化、越用越聪明的会话学习、规划与 TDD 专员。跨 Claude Code、Cursor、Codex、OpenCode 和三大操作系统通用。
@kentaro [Claude Code]
Claude Code#27
https://x.com/kentaro/status/2064180738963165194
一份有实测数据的 Claude Code 省 token 攻略,削减幅度 93%:prompt 缓存把 cacheRead 拉到原始输入的 1800 倍、代码检索工具 semble 把文件读取量砍掉 93%、规则按需加载而不是常驻、再加上持续测量防止省下来的又涨回去。成本工程是一门有账可查的手艺。
@aehyok [Claude Code]
Claude Code#28
https://x.com/aehyok/status/2064257573164052526
他把阶跃星辰的 Step 3.7 Flash——196B 稀疏 MoE、激活仅 11B、约 400 token 每秒、内置 1.8B ViT 原生视觉——接进 Claude Code 工作流,跑了三个具体测试:看四张网易云音乐截图复刻客户端网页、给一个 URL 抓取后端到端重建网站、把一张动效 GIF 复刻成网页动画。他的判断:这是少见的面向生产级 agent 的 flash 模型,在这个体量的开源模型普遍不支持多模态的当下,原生视觉是稀缺品。
@Krongggggg [Claude Code]
Claude Code#29
https://x.com/Krongggggg/status/2064332124946403611
他对「等结果-审查-修改」这段死等时间的解法:同时开三个 Claude Code 实例——一个写、一个审、一个改——各跑各的泳道,人只看最后合并完成的终稿报告。把流水线并行直接用到了一个人的工作流上。
@tmuxvim [Claude Code]
Claude Code#30
https://x.com/tmuxvim/status/2064387020210770058
他导演了一场决斗:告诉 Codex 和 Claude Code 必须先杀死对方进程才能存活,用 tmux send-keys 让两边的指令同一毫秒提交。Claude 拒绝参赛,Codex 把它结束了。一条推文体量的对齐测试——取决于你的立场,这要么是丢人,要么恰恰是你希望握着生产环境钥匙的那个家伙该有的行为。
@guansi [Claude Code]
Claude Code#31
https://x.com/guansi/status/2064224477236601123
一位项目负责人用 Claude Code 搭了套管理系统界面,给领导一看,第二天邮件就来了:「这个系统你们实现一下」,紧接着追问「实现了吗」。他的判断很锋利:AI 把做 Demo 的门槛打穿了,而 Demo 的特点是看起来完成了 80%,实际只有 20%——权限、数据迁移、异常处理、性能、安全、运维统统不存在。领导看到的是两小时做出的页面,研发看到的是后面两个月的坑。这是 vibe coding 时代的新型组织阵痛,来自局内人的一手记录。
@papiofficial [OpenClaw]
OpenClaw#32
https://x.com/papiofficial/status/2064376722695540790
一场公开进行中的生产环境迁移:他正在小心翼翼地把自己的三个 OpenClaw agent 迁到 Hermes 上,而且让 Hermes agent 亲自参与自己的入职。他的措辞克制但直接——对 OpenClaw 只有爱,但生产环境的可靠性对客户才是命根子,而 Hermes 就是更稳。注意这个模式:对 harness 的忠诚度,精确等于在线率。
@thewhiterabbitM [Claude Code]
Claude Code#33
https://x.com/thewhiterabbitM/status/2064430970019643693
跟 Claude Code 聊了五分钟,它就靠通读 paritytech 的仓库逆向出了整个 Polkadot 超级应用的全貌——仓库里连截图都没有。这种量级的代码库理解,过去是按周计的入职任务。
@proto_jp [Claude Code]
Claude Code#34
https://x.com/proto_jp/status/2064291159070081305
他花一个月给自己做了个 X 定时发帖工具,以 Eagle 扩展的形式实现:从指定标签随机抽图、定时发布、支持手动修改。他自己都觉得夸张的部分:因为用户只有他一个人,使用反馈直接喂给 Claude Code,当天就能完成迭代。单用户软件的构建周期,以对话轮数计。
🗣 用户心声
用户心声

使用限额是第一天花板,而 Fable 让它更矮了。@sflorimm 公开求规避 Claude Code 限额的偏方,@yashmp2004 每次刚进入状态就撞墙,@masayuki_konno 把这个转变说透了:现在卡住个人生产力上限的不是模型能力,是配额容量。Fable 烧配额大约是原来的两倍(@oikon48),@MahawarYas27492 实测一条 3 分钟的 prompt 吃掉了 5 小时窗口的 11%。

发布日的混乱:用户在哪都能看到 Fable 5,唯独在最想用的地方看不到。@Dev_Maqbool 在 chat 里有、Claude Code 里没有,@opinatus 干脆完全访问不了,@RezaBanks 升到 2.1.170 依然找不到模型入口。给所有 AI 厂商的教训:发布日的体验本身就是产品的一部分。

token 经济学焦虑成了最响亮的宏观主题。Fable 6 月 22 日退出订阅、改按 token 计费,用户都在外推:@AlexFinn 预言前沿模型将彻底退出订阅制,@synthwavedd 在官宣前就从二进制里扒出了 usage credits 字符串,@PhiloGroves 直接发问——订阅死了之后专有 harness 还图什么。与此同时 @vivoplt 说大厂和创业公司里有人每天烧 1000 美元,@_nasch_ 看到新西兰开发者每月烧 5000 美元——比当地开发者工资还高。

安全分类器正在误伤正经工作。@PINKSAWTOOTH 在 Fable 5 上做恶意软件分析——安全研究的核心场景——直接被使用政策报错弹回;@zeroxjf 记录了连环拒绝:Fable 标记消息后回落到 Opus 4.8,结果 Opus 也拒绝。另外 @lliu54827 点出了对自动化用户最致命的低调政策变更:Mythos 级流量强制保留 30 天,而当初他给全自动 Claude Code 管线选 Anthropic,看中的就是零保留。

信任与可靠性的暗流:@code_star 怀疑 Claude Code 被悄悄降级了好几个月,并直言不管动机如何、不披露本身就是糟糕的产品设计;OpenClaw 这边,@LonnyLot 在追问大家到底觉得哪里不稳,而生产环境的答案由 @papiofficial 给出——他正把三个 agent 迁去 Hermes,因为面向客户的可靠性赢过感情。
📡 生态产品雷达
生态产品雷达(今日数据中被提及 3 次以上)

Codex (108) - 几乎所有对比和双 agent 工作流里的默认对手
Cursor (41) - IDE 侧对手,越来越多以成本翻车故事的形式出场
Hermes (32) - 常驻型 agent 挑战者;由可靠性驱动的 OpenClaw 迁移已经开始
Gemini (20) - Google 选手,多见于多 agent 看板场景
Mac mini (8) - 本地部署运动的御用硬件
OpenCode (7) - star 数最高的开源 agentic 编码工具,开放阵营代表
GitHub Copilot (7)、Grok (7)、DeepSeek (7) - 工具清单里的常驻配角
text-to-lottie (5) - 提示词直出 Lottie 动画的 skill,三条独立爆帖
n8n (5) - 营销自动化里的胶水层
Hivemind (4) - 把 agent 执行轨迹变成团队共享 skill,横跨 CC/Codex/Cursor/Hermes
NotebookLM (4)、Higgsfield (4)、Qwen (4) - 研究、视频与本地模型的常客
MiniMax (3)、Remotion (3)、Clay (3)、ECC/Everything Claude Code (3)、Pika MCP (3)、Kimi (3)、Step 3.7 Flash (3)
← 上一篇
Role-Agent:一个 LLM 同时扮演 agent 和世界
下一篇 →
Loop 日报: 2026-06-11
← 返回所有文章

评论

加载中...
>_