2026年6月11日super-user

超级用户日报: 2026-06-11

Fable 5 在这个周期中段落地，效果立竿见影：最有意思的帖子已经不再讨论 prompt，而是讨论 loop、验证器、以及一个 agent 无人看管跑 48 小时会发生什么。第二条主线是 Claude Code 正在彻底逃离终端——Meta 广告、冷邮件、报税、学术写作、Blender 动画，甚至还有跑在 OpenClaw 上的机器人小车。而在这一切之下，整个社区都在计算同一道数学题：6 月 22 日补贴 token 时代结束之后怎么办。

@cyntro_py [Claude Code]

Claude Code#1

https://x.com/cyntro_py/status/2064389314910552442

他把能找到的公开 Claude Code dynamic workflow 全爬了一遍：500 多个仓库里的 1245 个脚本，然后做了排名和分类。产出是一张超级用户如何编排 agent 舰队的实证地图，浓缩成 10 个高频模式：结构化输出、并行扇出、多阶段、流水线、预算感知、嵌套 workflow、对抗性验证、评审团、调度者-工人、循环到收敛。结构化输出几乎人人在用，因为有校验的 JSON 才能让编排器基于真实数据做分支、让任务可恢复。对抗性验证和评审团是手艺所在——先派几个唱反调的 agent 试图推翻结论，扛得住才算数。

@IngenieroSeed [Claude Code]

Claude Code#2

https://x.com/IngenieroSeed/status/2064357933614240246

他在 90 美元每月的 Max 5x 套餐上，开了三个 Claude Code 会话同时跑 ultracode 模式，/goal 全程激活、权限拉满，连续跑了整整 48 小时。零崩溃、零卡死、全程在线——最后是因为实验该结束了才手动关掉，不是因为出了任何问题。这是「自主连续运行到底能跑多远」的一个硬数据点。

@theo [Claude Code]

Claude Code#3

https://x.com/theo/status/2064214943210324243

重新订阅 200 美元的 Claude Code 才 10 天，ccusage 显示他已经烧掉了价值 1100 多美元的推理量。最有意思的是：这些钱大部分不是花在写代码上，而是花在审计 GPT 5.5 干的活上。token 成了规模化的第二意见。

@qkl2058 [Claude Code]

Claude Code#4

https://x.com/qkl2058/status/2064368318119883057

一个 16 岁少年靠星链信标定位设备赚了约 30 万美元的故事。硬件是 35 美元的 RTL-SDR 接收器、小型 Ku 波段天线锅、LNB 加树莓派 5，物料成本约 180 美元。Claude Code 负责写 Python：抓星链信标信号、用公开的 TLE 轨道数据识别卫星、靠三颗卫星的多普勒频移做三角定位，精度 10 到 30 米，不依赖 GPS、手机信号和互联网。他 3D 打印了外壳，以 899 美元一台卖了 350 台，客户是徒步者、船员和野火应急队。接收公开广播信标是合法的——律师提前确认过。

@humzaakhalid [Claude Code]

OpenClaw#5

https://x.com/humzaakhalid/status/2064334184680943678

本周刷屏的本地部署账本：一位开发者 10 天烧出 170 美元的 Claude Code 账单后，用一台 599 美元的 Mac mini M4 跑 ollama 替代了云端开销。技术栈：Claude Code 指向 localhost，qwen 3.6 14b 写代码，deepseek r1 14b 做推理，gemma 4 4b 干杂活，外加一个跑在 Telegram 上的 openclaw 守护进程。他算的账是每月 3 美元电费对比每月 459 美元订阅费——第一年省 5232 美元，且数据不出本机。这个故事本周被至少五六个账号轮番转述，足以说明成本焦虑咬得有多狠。

@Ubermenscchh [Claude Code]

Claude Code#6

https://x.com/Ubermenscchh/status/2064367246173217199

丹麦地球物理学博士 Mads Lorentzen 把自己的求职申请机器整套开源了，基于 Claude Code，MIT 协议。fork 仓库、填一次个人背景，之后每个职位自动跑五步流水线：给岗位匹配度打分、挑选相关经历生成定制 LaTeX 简历、写求职信、由第二个 agent 对抗性审稿并强制修改、最后编译成可直接投递的 PDF。所有环节都是可读可改的纯 markdown。489 星、270 fork——这个 fork 比例说明大家是真在用，不是收藏夹吃灰。

@madebydia [Claude Code]

OpenClaw#7

https://x.com/madebydia/status/2064325718385787389

一位全职在家带娃的家长把 Claude Remote Control、OpenClaw、Hermes 和 Codex 全试了一遍，最后落在一套经得起带娃现实考验的手机优先方案上：iPhone 上的 Codex app 远程驱动 MacBook 跑长任务，发条 10 到 20 秒的消息就能开工；日常琐事走 iMessage 上的 Hermes——对着手表说 3 秒钟就能记饮食、记待办，连手机都不用掏。这是用一个真实指标——「带娃时还能不能用」——对四套 agent 方案做的诚实横评。

@aniketapanjwani [Claude Code]

Claude Code#8

https://x.com/aniketapanjwani/status/2064454133185180061

给有 Claude Code 订阅的学者的玩法：把自己过往的论文分别喂给 Fable 和 Opus，让它们各自蒸馏出一个「你的文风」skill。然后在新论文上，让 Opus 在两个独立线程里分别套用这两个 skill，对比哪个模型更抓得住你的声音。他提醒 Fable 只included到 6 月 23 日，所以做这种对比实验、以及沉淀那些访问权结束后还能留下的流程改进，窗口期就是现在。

@QingQ77 [Claude Code]

Claude Code#9

https://x.com/QingQ77/status/2064297705099169886

面向中文科研工作者的一体化学术技能包，在 Claude Code 和 Codex 上直接可用。三个可串联的 skill：research-writing-skill 负责写论文、改稿和回复审稿人，默认中文；office-academic-skill 负责文献汇报、组会 PPT 和答辩 PPT，输出可编辑文件；scientific-toolkit-skill 包装了 MATLAB/Python 计算、论文图表和文献检索，面向光电方向。先算数据出图、再写论文、最后做答辩 PPT——一条流水线跑完。

@Seannywilson [Claude Code]

Claude Code#10

https://x.com/Seannywilson/status/2064422934215643156

一次完全在 Claude Code 里跑完的 30 分钟 GTM 冲刺：用 DiscoLike 把整个目标市场映射、筛选、打分，用 Prospeo、AI Ark、BlitzAPI 找人，用 PredictLeads 按在招职位过滤，用 Icypeas、BetterContact、LeadMagic 补全数据，再叠加 Exa 和 Parallel 做深度调研（公告、融资、新员工动向），基于全部数据写文案，最后推送到 Instantly。过去要在 Clay 里耗几天的活，压缩到几分钟——销售运营变成了一个工具调用问题。

@mikefutia [Claude Code]

Claude Code#11

https://x.com/mikefutia/status/2064446547505602605

一个用五个 skill 跑完整套 Meta 广告流程的 Claude Code 插件：/spy 抓取竞品所有在投广告，按投放时长排序（逻辑是活得久等于被验证过）；/competitors-extractor 把 3 到 5 个品牌正面对比，找出没人用的角度；/bulk-creative 基于胜出角度批量生成 20 条品牌调性文案；/ad-score 在花钱之前按六个维度给每条广告打 0 到 100 分；/ad-matter 通过 Meta 官方 MCP 审计在投账户，输出按优先级排序的修复清单。他的卖点是替代每月 300 美元的间谍工具和一部分代理公司的活。

@coldemailchris [Claude Code]

Claude Code#12

https://x.com/coldemailchris/status/2064377093618565469

一套跑在 Claude Code、Clay 和 n8n 上的全自动冷邮件系统，按 skill 逐个拆解：GTM 战役论点生成器、带真实案例的 TAM 映射、自动挑选最佳数据源的客户开发 agent、联系人数据补全流、随时间迭代文案的消息 skill、专抓正在投广告和正在招人的公司的爬虫、按意向和价值给线索打分的回复管理 agent、对高价值回复做电话号码补全、以及实时撰写定制回复的草稿 agent。整个营收前台被拆成了一摞 agent。

@dvassallo [OpenClaw]

OpenClaw#13

https://x.com/dvassallo/status/2064476197241946113

他用 openclaw 加 TurboTax 报完了 2025 年的税——也撞上了当今 agent 的真实天花板。数字 agent 都算对了，但报税网站表单的复杂度让 Opus 和 GPT 双双折戟，最后他只能手动把 agent 算好的数字一个个填进去。一个精确而不性感的数据点：卡住正经非编码工作的不是推理能力，是对 agent 不友好的网页 UI。

@Hexblade_eth [OpenClaw]

OpenClaw#14

https://x.com/Hexblade_eth/status/2064370605521256507

对 WorkClaw（面向团队的 OpenClaw 衍生品）的实测结论：他上周「入职」了一个，在 Slack 里跑运营，确实交付了真活——日历分诊、供应商邮件、浏览器取数、Notion 更新，全在它自带 3000 个集成的 ClawOS 云电脑里完成。他也给出了公允的质疑：云端自主权是安全隐患，相比本地 OpenClaw 有锁定风险。他的判断：配合 SkillSpector、任务流状态和严格的管理员控制，它跨过了「能用」这条线——像雇了个永不睡觉的实习生。

@dfect [OpenClaw]

OpenClaw#15

https://x.com/dfect/status/2064352062737916388

他让 AI 替他买了电影票：把指令交给自己的 agent——Claude Code、Codex 或 OpenClaw 哪个都行——agent 自己生成了一个稳定币钱包、完成支付，然后返回两个可在 Cinepolis 兑换的取票码。agent 对 agent 的商业交易发生在现实生活里，不是白皮书里。

@kleffew94 [Claude Code]

Claude Code#16

https://x.com/kleffew94/status/2064398174677258347

一场 x402 付费工具调用的现场演示，搭档是 Solana 和 Coinbase AWAL：Claude Code 检索纽约尼克斯队的最新社交与新闻语境，整理成 brief，再用 StableStudio 生成视频——在请求时发现付费工具、把多个工具捆进一个 workflow、并对每次调用的边际成本做推理。最有意思的框架是：同一个运行时里，workflow 既能花钱也能赚钱。

@akira_papa_IT [Claude Code]

Claude Code#17

https://x.com/akira_papa_IT/status/2064384668804461008

Claude Code 通过 MCP 全自动操作 Blender，做出一支 3D 俯卧撑健身视频，全程零手工：把棒人间修正成正确的 IK 关节运动、通过 API 拉取 Mixamo 角色、搭出健身房场景、调好自然光照、循环俯卧撑动作，再用 EEVEE 以每帧 0.2 秒的速度直接渲染成 MP4。一切靠聊天指令完成——没有 3D 美术也能跑通健身、体育内容流水线的雏形。

@Timmysofine [Claude Code]

Claude Code#18

https://x.com/Timmysofine/status/2064437810317394062

他上传了一段自己的视频，通过 Claude Code 跑 Pika MCP 上的 Language Swap Skill，然后看着自己说出一口流利的芬兰语——克隆音色、口型精准，逼真到他自己回看了两遍。配置就三步：添加 Pika MCP 服务器并在 Claude Code 里完成认证，用 npx 装配套 skill，上传视频、说出目标语言。创作者的本地化工作正在坍缩成一次 skill 调用。

@xiaohu [Claude Code]

Claude Code#19

https://x.com/xiaohu/status/2064190407198875730

装上他那套工具链之后，Claude Code 或 Codex 直接变身视频剪辑师：他让 AI 翻译一段 WWDC 2026 的视频，并按内容分析自动把视频精准裁切成多个独立片段。一句聊天指令，就能做基于内容理解的自动剪辑。

@murasametech [OpenClaw]

OpenClaw#20

https://x.com/murasametech/status/2064182166016467284

OpenClaw 控制实体机器人小车：一台跑在树莓派上的 Stack-chan 小车，现在已经能避开人自由行驶。路线图上的下一个里程碑：目标物扫描——具体来说，是找到一只卡比兽毛绒玩具。小而可爱，但证明了 agent harness 可以泛化到具身硬件上。

@davis7 [Claude Code]

Claude Code#21

https://x.com/davis7/status/2064457646653215094

一线开发者的 Fable 第一天：Effect v4 代码片段的质量开箱即扎实，跨 convex、cloudflare、depot、clerk 的部署任务也不用人扶着走。他还顺手给 Claude Code 本体正名——workflow、auto mode、研究型子 agent 都很好用。最妙的细节：auto mode 下模型发现自己被权限检查拦住了，主动让他回复一句明确批准好让检查放行。最大的槽点：速度和价格——哪怕开低推理档，推个简单改动也要好几分钟。

@_xjdr [Claude Code]

Claude Code#22

https://x.com/_xjdr/status/2064465305917935654

一位严谨怀疑派的评测：他从一月起就没碰过 Anthropic 的模型，这次把 Fable 扔进自己的 benchmark 和最难啃的几个仓库里跑。结论：相比 Opus 是巨大进步，尤其擅长大型多模块 review——抓出了好几个真正隐蔽的 bug——和长链路多步骤任务。但就他的场景而言，仍不及 GPT 5.5 xhigh，刨去 Claude Code 新特性后跟他自己微调的 K2.6 基本打平。他打算再用一天确认，然后回到 80/20 的老配比。这是发布日最有公信力的一份偏负面评测。

@Steve8708 [Claude Code]

Claude Code#23

https://x.com/Steve8708/status/2064369026030277013

重度双开几周后的体感记分卡：Codex 配 GPT 5.5 快得多、便宜得多、更少撞限额、指令遵循更好、更不需要看管；Claude Code 配 Opus 4.8 赢在 dynamic workflow、子 agent 调度和方案生成，但慢得痛苦、限额吃得凶。他最终的工作流：默认 Codex，遇到大难题、需要 dynamic workflow 或者要生成方案再交给 Codex 实现时才换 Claude Code。这才是最有用的对比姿势：不问谁更强，问同一个厨房里谁切菜谁掌勺。

@irl_danB [Claude Code]

#24

https://x.com/irl_danB/status/2064184976556572901

Dynamic workflow 的 JS 环境在技术上禁止递归，于是他花了一个周末照样把递归 workflow 做了出来——用的是 trampolining（蹦床技法）：外层事件循环把内层 agent 调用当成虚拟递归栈来管理。这正是他当年把 Claude 深度只有 1 的子 agent 架构硬撑成深层嵌套结构的同一招，源头是 Spring 时代的 Java 接线手艺。他承认共享状态有坑，但没有一个是没解过的。超级用户从不等功能上线，他们直接用计算机科学把功能造出来。

@alphabatcher [Claude Code]

#25

https://x.com/alphabatcher/status/2064441748974383439

一份可以直接抄的 5 天计划，把你从写 prompt 带到 Boris Cherny 式的写 loop。第 1 天：用 CLAUDE.md 建仓库记忆，加上允许执行的 shell 命令清单。第 2 天：给 Claude 最常搞坏的那个流程写一个验证 skill，返回通过与否加日志。第 3 天：三个命令——babysit 盯 PR 和 CI、triage-issues 分诊 issue、deploy-watch 盯线上。第 4 天：用 /loop 以 5 到 15 分钟的间隔把它们跑起来。第 5 天：过夜定时任务把报告写进收件箱文件夹，早晨的 loop 负责读。铁律：每个写代码的 loop 必须配一个独立的验证者，否则你醒来会看到 14 个坏掉的 PR，每个都配着信心十足的总结。

@manishamishra24 [Claude Code]

Claude Code#26

https://x.com/manishamishra24/status/2064291199280886026

Affaan Mustafa 用 Claude Code 在 8 小时内搭出一个完整 startup，拿下 Anthropic x Forum Ventures 黑客松冠军——然后把全套配置开源成了 Everything Claude Code（仓库 affaan-m/ecc，MIT 协议）。这是十个月日常使用打磨出来的系统：庞大的 skill 库加几十个专职子 agent——OWASP 安全审查、防止 Claude 三小时后忘记此前决策的记忆优化、越用越聪明的会话学习、规划与 TDD 专员。跨 Claude Code、Cursor、Codex、OpenCode 和三大操作系统通用。

@kentaro [Claude Code]

Claude Code#27

https://x.com/kentaro/status/2064180738963165194

一份有实测数据的 Claude Code 省 token 攻略，削减幅度 93%：prompt 缓存把 cacheRead 拉到原始输入的 1800 倍、代码检索工具 semble 把文件读取量砍掉 93%、规则按需加载而不是常驻、再加上持续测量防止省下来的又涨回去。成本工程是一门有账可查的手艺。

@aehyok [Claude Code]

Claude Code#28

https://x.com/aehyok/status/2064257573164052526

他把阶跃星辰的 Step 3.7 Flash——196B 稀疏 MoE、激活仅 11B、约 400 token 每秒、内置 1.8B ViT 原生视觉——接进 Claude Code 工作流，跑了三个具体测试：看四张网易云音乐截图复刻客户端网页、给一个 URL 抓取后端到端重建网站、把一张动效 GIF 复刻成网页动画。他的判断：这是少见的面向生产级 agent 的 flash 模型，在这个体量的开源模型普遍不支持多模态的当下，原生视觉是稀缺品。

@Krongggggg [Claude Code]

Claude Code#29

https://x.com/Krongggggg/status/2064332124946403611

他对「等结果-审查-修改」这段死等时间的解法：同时开三个 Claude Code 实例——一个写、一个审、一个改——各跑各的泳道，人只看最后合并完成的终稿报告。把流水线并行直接用到了一个人的工作流上。

@tmuxvim [Claude Code]

Claude Code#30

https://x.com/tmuxvim/status/2064387020210770058

他导演了一场决斗：告诉 Codex 和 Claude Code 必须先杀死对方进程才能存活，用 tmux send-keys 让两边的指令同一毫秒提交。Claude 拒绝参赛，Codex 把它结束了。一条推文体量的对齐测试——取决于你的立场，这要么是丢人，要么恰恰是你希望握着生产环境钥匙的那个家伙该有的行为。

@guansi [Claude Code]

Claude Code#31

https://x.com/guansi/status/2064224477236601123

一位项目负责人用 Claude Code 搭了套管理系统界面，给领导一看，第二天邮件就来了：「这个系统你们实现一下」，紧接着追问「实现了吗」。他的判断很锋利：AI 把做 Demo 的门槛打穿了，而 Demo 的特点是看起来完成了 80%，实际只有 20%——权限、数据迁移、异常处理、性能、安全、运维统统不存在。领导看到的是两小时做出的页面，研发看到的是后面两个月的坑。这是 vibe coding 时代的新型组织阵痛，来自局内人的一手记录。

@papiofficial [OpenClaw]

OpenClaw#32

https://x.com/papiofficial/status/2064376722695540790

一场公开进行中的生产环境迁移：他正在小心翼翼地把自己的三个 OpenClaw agent 迁到 Hermes 上，而且让 Hermes agent 亲自参与自己的入职。他的措辞克制但直接——对 OpenClaw 只有爱，但生产环境的可靠性对客户才是命根子，而 Hermes 就是更稳。注意这个模式：对 harness 的忠诚度，精确等于在线率。

@thewhiterabbitM [Claude Code]

Claude Code#33

https://x.com/thewhiterabbitM/status/2064430970019643693

跟 Claude Code 聊了五分钟，它就靠通读 paritytech 的仓库逆向出了整个 Polkadot 超级应用的全貌——仓库里连截图都没有。这种量级的代码库理解，过去是按周计的入职任务。

@proto_jp [Claude Code]

Claude Code#34

https://x.com/proto_jp/status/2064291159070081305

他花一个月给自己做了个 X 定时发帖工具，以 Eagle 扩展的形式实现：从指定标签随机抽图、定时发布、支持手动修改。他自己都觉得夸张的部分：因为用户只有他一个人，使用反馈直接喂给 Claude Code，当天就能完成迭代。单用户软件的构建周期，以对话轮数计。

🗣 用户心声

用户心声

使用限额是第一天花板，而 Fable 让它更矮了。@sflorimm 公开求规避 Claude Code 限额的偏方，@yashmp2004 每次刚进入状态就撞墙，@masayuki_konno 把这个转变说透了：现在卡住个人生产力上限的不是模型能力，是配额容量。Fable 烧配额大约是原来的两倍（@oikon48），@MahawarYas27492 实测一条 3 分钟的 prompt 吃掉了 5 小时窗口的 11%。

发布日的混乱：用户在哪都能看到 Fable 5，唯独在最想用的地方看不到。@Dev_Maqbool 在 chat 里有、Claude Code 里没有，@opinatus 干脆完全访问不了，@RezaBanks 升到 2.1.170 依然找不到模型入口。给所有 AI 厂商的教训：发布日的体验本身就是产品的一部分。

token 经济学焦虑成了最响亮的宏观主题。Fable 6 月 22 日退出订阅、改按 token 计费，用户都在外推：@AlexFinn 预言前沿模型将彻底退出订阅制，@synthwavedd 在官宣前就从二进制里扒出了 usage credits 字符串，@PhiloGroves 直接发问——订阅死了之后专有 harness 还图什么。与此同时 @vivoplt 说大厂和创业公司里有人每天烧 1000 美元，@_nasch_ 看到新西兰开发者每月烧 5000 美元——比当地开发者工资还高。

安全分类器正在误伤正经工作。@PINKSAWTOOTH 在 Fable 5 上做恶意软件分析——安全研究的核心场景——直接被使用政策报错弹回；@zeroxjf 记录了连环拒绝：Fable 标记消息后回落到 Opus 4.8，结果 Opus 也拒绝。另外 @lliu54827 点出了对自动化用户最致命的低调政策变更：Mythos 级流量强制保留 30 天，而当初他给全自动 Claude Code 管线选 Anthropic，看中的就是零保留。

信任与可靠性的暗流：@code_star 怀疑 Claude Code 被悄悄降级了好几个月，并直言不管动机如何、不披露本身就是糟糕的产品设计；OpenClaw 这边，@LonnyLot 在追问大家到底觉得哪里不稳，而生产环境的答案由 @papiofficial 给出——他正把三个 agent 迁去 Hermes，因为面向客户的可靠性赢过感情。

📡 生态产品雷达

生态产品雷达（今日数据中被提及 3 次以上）

Codex (108) - 几乎所有对比和双 agent 工作流里的默认对手
Cursor (41) - IDE 侧对手，越来越多以成本翻车故事的形式出场
Hermes (32) - 常驻型 agent 挑战者；由可靠性驱动的 OpenClaw 迁移已经开始
Gemini (20) - Google 选手，多见于多 agent 看板场景
Mac mini (8) - 本地部署运动的御用硬件
OpenCode (7) - star 数最高的开源 agentic 编码工具，开放阵营代表
GitHub Copilot (7)、Grok (7)、DeepSeek (7) - 工具清单里的常驻配角
text-to-lottie (5) - 提示词直出 Lottie 动画的 skill，三条独立爆帖
n8n (5) - 营销自动化里的胶水层
Hivemind (4) - 把 agent 执行轨迹变成团队共享 skill，横跨 CC/Codex/Cursor/Hermes
NotebookLM (4)、Higgsfield (4)、Qwen (4) - 研究、视频与本地模型的常客
MiniMax (3)、Remotion (3)、Clay (3)、ECC/Everything Claude Code (3)、Pika MCP (3)、Kimi (3)、Step 3.7 Flash (3)

← 上一篇

Role-Agent：一个 LLM 同时扮演 agent 和世界

Loop 日报: 2026-06-11

← 返回所有文章

加载中...

超级用户日报: 2026-06-11

相关文章

评论