超级用户日报: 2026-06-04
这周时间线很吵,但大部分噪音是 IPO 估值和微软的舞台秀。剥开这层,真正的信号是:人们已经不再把这些 agent 当成高级自动补全,而是开始把它们接进能自己跑起来的系统里。反复出现的套路是——给 agent 一个目标、几条护栏、一个循环,然后人走开。交易台、研究流水线、语音模型、广告工厂,甚至把一个大模型跑在二手 FPGA 上。有意思的不是代码被写出来了,而是人们现在愿意把多大一块"周边系统"交给 agent 自己管。
@InvestwithMEH [Claude Code]
https://x.com/InvestwithMEH/status/2061885202247356655
搭建 agentic 对冲基金的第一天,整个骨架在一次约 45 分钟的 Claude Code 会话里就立起来了。他把 Claude Agent SDK 接到 Robinhood 新上线的 agentic MCP 端点,直接从 Claude Code 的 macOS Keychain 里抠出 OAuth bearer,搭了一个六层架构(数据、研究、执行、组合、监控、agent),每一层都是真正的 Python 包。一个 launchd 定时任务每个工作日早上 8:30(美东)触发盘前流程,写下持仓状态备忘,追加到决策日志。agent 对每一次工具调用都给出理由并记录推理,所以可审计性是内建的而不是事后补的。这就是"问 AI 要个交易点子"和"把真正的管道交给它"之间的区别。
@shev_webmarke [Claude Code]
https://x.com/shev_webmarke/status/2061632481603031512
一个非设计师如何用 GPT-Image-2 稳定产出广告图,Claude Code 充当分析大脑。他的核心洞察是:指令含糊每次都会漂移,所以你拿一个简单 prompt 生成五个变体,把好的坏的都喂回 Claude,让它指出到底是哪条指令导致了漂移。Claude 比对这些变体,告诉你需要明确什么(模特视线角度、文字位置、CTA 按钮颜色),并替你写出收紧后的 prompt。然后在复杂 prompt 上重复,直到抖动消失。这是把 prompt 工程重新定义成一个可测量的反馈循环,而且操盘的是一个根本不会设计的人。
@aakashgupta [Claude Code]
https://x.com/aakashgupta/status/2061839510053482777
他受够了所谓"自更新记忆"只是配置文件里一句客气话——上下文一满模型立刻就把它丢了,于是给 Claude Code 真正造了一个三层结构,还花了五天打磨加固。第一层 Advisory 是 CLAUDE.md 里的规则(照例会腐烂)。真正关键的是第二层 Deterministic:一个 hook 在文件写入的瞬间触发,拦截任何没附来源的论断;另一个在会话结束时触发,不把学到的东西归档保存就不让会话关闭。第三层 Self-improvement,也就是 agent 改写自己的运行规则,刻意保留人工审批。这条花了五天才换来的界线是:知识的自更新做成确定性的,行为的自更新保留人在环。
@kevinma_dev_zh [Claude Code]
https://x.com/kevinma_dev_zh/status/2061630933158232122
一个真正巧妙的非编码循环,服务于他的产品 SentiaRead。他让一个叫 Eva 的 agent 在云手机上 7×24 刷小红书,收集英语学习者的真实吐槽(查词打断阅读流、学了没进步、收藏一堆坚持不下去)。然后通过扣子 3.0 的多 agent 能力把它接到本地 Claude Code,后者能访问代码库、项目文档,还能通过 Linear MCP 读 issue。分工很刻意:Eva 负责收集归类痛点、提取用户原话,他再决定哪些反馈进 Linear 变成产品任务、哪些拿去做内容(X thread、小红书笔记)。外部用户反馈被直接接进产品迭代和营销两条管线。
@dikibagast [Claude Code]
https://x.com/dikibagast/status/2061672624904876287
一套通过 AI agent 测试系统化交易策略、同时死磕过拟合的私有框架。他专门写了 markdown 文件让 agent(Claude Code、OpenCode)天然就懂怎么写出与工作流兼容的脚本,所以他只要丢个想法过去。框架会拉取各周期的 OHLCV 数据,跑单次回测,再做完整的 walk-forward 优化加统计验证,在成千上万组参数里找到稳健的甜区,而不是一条过拟合的曲线。全程本地运行,一旦策略足够有把握,回测脚本就转成自动交易策略。这套纪律,正是绝大多数"AI 交易机器人"帖子完全跳过的部分。
@MushtaqBilalPhD [Claude Code]
https://x.com/MushtaqBilalPhD/status/2061767476493570362
用 Claude Code、两条 prompt 自动化系统性文献综述里的标题/摘要筛选环节。做过学术研究的人都懂,这道筛选是最折磨人的活:成百上千篇论文,一篇篇手动标注纳入/排除。他演示了怎么建一个"systematic review"文件夹,让 Claude Code 做第一遍过滤。这根本不是编码场景,恰恰因此重要:高杠杆的 agent 工作正越来越多地发生在软件之外,发生在那些过去要吃掉研究者一整周的重复判断任务上。
@scalperof [Claude Code]
https://x.com/scalperof/status/2061761245942886566
一边备考 KPSS,一边用 Claude Code 把整个 KPSS 备考 App 做了出来,现在已经上架 Play Store。他抓取并改写了 2011-2021 年的真题做成原创题,载入 400 多张知识卡(目标 1000+),加了 AI 出题功能和模拟考,整个免费。最戳人的细节是:他需要的工具不存在,于是这个考生为所有其他考生把它做了出来。这正在成为新常态,而做这件事的门槛还在不断往下掉。
@irl_danB [Claude Code]
https://x.com/irl_danB/status/2061929789355962493
他把公司大部分运营都放在一个目录里(理念、规格、代码、分析、烧钱模型、销售 CRM),受够了每次现实变了都要手动让 Claude Code 去"快进"更新各个模型。于是他造了 Reactor Harness:想象 React,只不过它维护的不是 DOM,而是一个"理想世界模型"——当上游事件变化时,重新渲染被声明的那些切面。它本质是一个 agent 会话的 DAG,每个节点都做了 memoization,下游会话只在输入真的变了才重跑。他之前试过把 agent 脚本放进 cron,结果烧钱飞快;memoization 就是解法。他在追的目标很疯:维护世界模型的推理成本随"意外程度"伸缩,而不是随墙上的时间走。
@zach_coredump [Claude Code]
https://x.com/zach_coredump/status/2061754287173378285
过去一个月,他把一个"LLM 跑在 FPGA 上"的 demo 从 KR260 板子迁移到二手的赛灵思 U50,并把这归功于 Claude Code(他强调是自费的)帮他改代码、重构、debug,让他能在一个月里把 LLM 跑在 FPGA 上。他还做了基准测试:速度跟自己的 MacBook Pro M3 Max 128GB 差不多,但能耗比明显更好。这离"随手生成个落地页"远到不能再远了——一个 agent 在不熟悉的硬件上做真正的系统工程,正好回击那些说这类工具只会写网页 CRUD 的人。
@shinshin86 [Claude Code]
https://x.com/shinshin86/status/2061797074816123017
用 Claude Code 下指令,几乎放手就能做出原创语音模型。流程是:把一段基础语音交给 Claude,让它在 Irodori-TTS VoiceDesign 里调声音和 caption 输入来量产训练数据,再训练一个可复用的模型。他诚实标出的那个限制其实才是真正的洞察:Claude 听不出一段声音具有什么属性,所以仍然需要人来审听成果。但只要解决这一个缺口,就能做到"用自然语言描述你想要的声音,就得到模型",由此打开自然语言驱动的 AI VTuber 嗓音和定制 AI 人格的大门。一个非编码场景,人扮演的是耳朵,不是工程师。
@maverickecom [Claude Code]
https://x.com/maverickecom/status/2061842175877399036
一个完全自动化的 AI UGC 工厂,建在 Claude Code 加 Fastmoss、Grok、CapCut 之上,把一个统一的 AI 权威人设变成成百上千条可购物的达人风格视频,每天铺到各个垂类账号。这套每月 300 美元的栈(manus 做选题研究、fastmoss 抓竞品爆款、nano banana pro 出图、kling 出视频)取代了他口中 5 万美元以上的创意预算,CPM 低至 0.10 美元。真正锋利的不是视频本身,而是学习量:每月测 500 多条创意而不是 25 条,于是找到的爆款多 20 倍。他把这套玩得像 2015 年的 Facebook 广告——趁所有人还没反应过来。
@KSimback [Claude Code]
https://x.com/KSimback/status/2061828182454698290
他给创业公司做顾问的那套配置,在一个 cyberfund 活动上演示过。Obsidian 是第二大脑,一切都进这里被索引;研究和顾问工作流从里面拉取、也往里面喂;agent 也是。在自己电脑上他用 Claude Code 和 Codex,远程和跑 cron/编排时用 Hermes agent(并说自己已经基本不用 OpenClaw 了)。核心是一套自定义 skill pack,带着公司走完 0 到 1 阶段的每个主要交付物。第二大脑能在他的顾问工作和研究之间做模式匹配,用得越多,它连起来的点就越多,那些他自己想不到的关联。
@mikefutia [Claude Code]
https://x.com/mikefutia/status/2061607289417842820
一个完全建在 Claude Code 里的内容引擎,能用品牌精确的语气写作、拒绝编造数据,并给每篇草稿打 0-100 的"AI 味"分。他把它对准 Grüns,喂进主页,几秒钟就建好了品牌语气画像(俏皮的反炒作调性、特定的节奏、目标受众、好评背书)。一篇帖子直接出到可发布状态,首轮打了 89/100,答案先行、用可被引用的疑问句小标题、零 AI 套话。架构是一个编排器加 writer/editor/researcher 子 agent。让它可信的关键是那个 AI 味打分器:一个内建的评分员,在你看到之前先给 agent 自己的产出打分。
@moacirmoda [Claude Code]
https://x.com/moacirmoda/status/2061829390980260104
一个不起眼但真有用的习惯,用来让你的技能产生复利。Claude Code 跑完一个大致摸清的流程后,问它这次会话的 ID,开一个新对话,把 ID 贴进去配上 prompt:分析整个会话,告诉我哪里错了、哪里对了、哪些被要求的东西现有 skill 没覆盖、要做哪些调整才能让下次更快、少在犯错上烧 token。只列清单,先别动手。这是一个手动的自我改进循环——把你自己的工作历史变成打磨 skill 的素材,而这恰恰是大多数人会跳过的一步。
@kota33000604 [Claude Code]
https://x.com/kota33000604/status/2061807399137370317
"Content as Code"(内容即代码)在他公司落地得很猛,是一个悄悄很聪明的非工程用法。市场和产品市场(PMM)的改动现在都走 Pull Request,跟工程师提交代码一样:PMM 改定位,市场改落地页,负责人 review。审的人不写代码,只看一个 preview URL、留行级评论、然后 Approve。解锁点在于 Claude Code 让 PMM 和市场就算不会写 HTML 也能交付 HTML。如果内容也是交付物,那像代码一样给它做版本管理,反而更快。
@PrajwalTomar_ [Claude Code]
https://x.com/PrajwalTomar_/status/2061741864664109377
他不再刷社交媒体看 AI 新闻,反而说自己比以前更跟得上,因为 Claude Code 每天早上 6 点替他读完整个互联网,按他关注的方向过滤,把一份简报丢进他的 Obsidian 库。没有 doomscrolling,没有 200 条讲同一个发布的推。这是个很小的个人自动化,但它正是那种过去需要把 RSS 阅读器、摘要器、笔记 App 拼在一起才能做到的事,现在变成了一个指向知识库的定时 agent 任务。
@wilderko [Claude Code]
https://x.com/wilderko/status/2061764221432385926
一个真有未来感的配置:他完全靠语音、通过 Even Realities AR 眼镜操作一个活跃的 Claude 会话。连接方式叫"Terminal Mode",扫描运行着 Claude Code 那个页面上的二维码激活,两端用 Tailscale VPN 桥接,避免在公网上明文通信。他用一个 R1 戒指或者点眼镜侧面来切换选项,可以双手不碰键盘地写代码、解问题。这段藏在一篇讲导航和实时翻译的长帖里,但"Claude 跑在眼镜上"这一段,是计算形态从"人去找设备"变成"设备跟着人走"的一次真实窥见。
@itsbrianscherer [Claude Code]
https://x.com/itsbrianscherer/status/2061854000476303576
来自一份个人与小型律所技术栈调查的硬数据,AI 的数字相当惊人。Claude 是整份报告里使用率最高的单一工具(84% 采用率、4.5/5 满意度)。在法律检索上,Claude 现在采用率(36%)反超 Westlaw(31%)——这事一年前听起来还很荒谬。而"vibe coding"这个十二个月前几乎不存在的类别,由 Claude Code 以 73% 领跑:律师们现在自己写软件了。当一个出了名保守的行业开始自己造工具,这条采用曲线就不再是科技泡沫的故事了。
@kj_kombat [Claude Code]
https://x.com/kj_kombat/status/2061777850781573531
炒作声中一个有用的现实校准。他花了 50 美元让 Claude Code 批量处理 1.2 GB 的 PDF,做父亲的审计工作,他诚实的结论是:他本可以按差不多的时薪请个数据工程师,于是说"我不觉得 AI 在取代我们"。这是一个真实、具体、带成本的活,而这份怀疑正是价值所在:不是每个批处理任务都是 100 倍的胜利,真正在付账单的人,才是最值得听的——听他们说经济账在哪里打平。
🗣 用户心声
用户心声
限流是当下第一大痛点,而且总在最糟的时刻打断心流。@Saanvi_dhillon 直接问:有没有办法用 Claude Code 不那么快撞到用量上限,"每次刚进入高效工作流,就撞限了"。连一个 Opus 4.8 子 agent 的 bug 都能悄悄烧光大家的额度(逼得 Anthropic 给所有人重置上限),可见在重度用户眼里这个预算有多脆。
成本焦虑紧随其后,而且很具体,不是空谈。@kj_kombat 一次 PDF 审计批处理就烧了 50 美元,公开质疑请个数据工程师是不是更便宜。整个"Mac mini 本地跑 Ollama"的浪潮之所以存在,就是因为人们在算 token 账单,而且不喜欢算出来的答案。
记忆无法跨工具迁移是个真实的结构性抱怨。@himanshutwtxs 一针见血:记忆是被 harness 圈住的,Claude Code 记住的东西对 Codex 毫无意义,解法是把记忆当成基础设施,而不是某个工具里的一个开关或一个 markdown 文件。很多人在自建可迁移的记忆层,因为内建的要么腐烂、要么带不走。
Opus 4.8 的质量回退被真实用户反复提起。@Fabiobuilds 发现网页版的 Opus 4.7 总在纠正 Claude Code 里的 Opus 4.8,"像在管一个暑期实习生",一份广为流传的新闻汇总也点出大量开发者反映 4.8 在代词追踪和跟住论证上更吃力。当你的核心用户都说最新的模型感觉变笨了,这值得认真听。
人们喜欢 Workflows,但想看到里面在发生什么。@dani_avila7 认为 Dynamic Workflows 的最大潜力,要等它进了 Claude Code Desktop、配上能可视化整个 agent 编排过程的 UI 才会释放,因为对这类系统"可观测性就是一切"。@daptonai 把一个过度积极的 agent 比作内存泄漏:一切看起来都好,直到一个真实任务在后台拉起了你从没要求过的活,你需要实时看到 agent 到底在干什么,而不只是看输出。
限流是当下第一大痛点,而且总在最糟的时刻打断心流。@Saanvi_dhillon 直接问:有没有办法用 Claude Code 不那么快撞到用量上限,"每次刚进入高效工作流,就撞限了"。连一个 Opus 4.8 子 agent 的 bug 都能悄悄烧光大家的额度(逼得 Anthropic 给所有人重置上限),可见在重度用户眼里这个预算有多脆。
成本焦虑紧随其后,而且很具体,不是空谈。@kj_kombat 一次 PDF 审计批处理就烧了 50 美元,公开质疑请个数据工程师是不是更便宜。整个"Mac mini 本地跑 Ollama"的浪潮之所以存在,就是因为人们在算 token 账单,而且不喜欢算出来的答案。
记忆无法跨工具迁移是个真实的结构性抱怨。@himanshutwtxs 一针见血:记忆是被 harness 圈住的,Claude Code 记住的东西对 Codex 毫无意义,解法是把记忆当成基础设施,而不是某个工具里的一个开关或一个 markdown 文件。很多人在自建可迁移的记忆层,因为内建的要么腐烂、要么带不走。
Opus 4.8 的质量回退被真实用户反复提起。@Fabiobuilds 发现网页版的 Opus 4.7 总在纠正 Claude Code 里的 Opus 4.8,"像在管一个暑期实习生",一份广为流传的新闻汇总也点出大量开发者反映 4.8 在代词追踪和跟住论证上更吃力。当你的核心用户都说最新的模型感觉变笨了,这值得认真听。
人们喜欢 Workflows,但想看到里面在发生什么。@dani_avila7 认为 Dynamic Workflows 的最大潜力,要等它进了 Claude Code Desktop、配上能可视化整个 agent 编排过程的 UI 才会释放,因为对这类系统"可观测性就是一切"。@daptonai 把一个过度积极的 agent 比作内存泄漏:一切看起来都好,直到一个真实任务在后台拉起了你从没要求过的活,你需要实时看到 agent 到底在干什么,而不只是看输出。
📡 生态产品雷达
生态产品雷达
NotebookLM 和 Obsidian 是这一轮的黑马组合,作为"研究流水线"反复与 Claude Code 配对出现:NotebookLM 吃源料,Obsidian 记住决策,Claude Code 调度任务。Codex 仍是恒定的对比对象兼副驾(很多人 Claude Code 和 Codex 并排开)。Cursor 通篇仍在出现,不过有好几条帖子提到开发者正回落到裸用 Claude Code。Hermes Agent 反复作为本地 agent 的远程/cron 搭档登场。Supabase 和 Vercel 是那批"四周搭一个完整 App/社交网络"帖子里默认的后端与部署栈。Ollama 锚定本地模型运动(把 Claude Code 指向本地模型,零 API 成本)。Claude Code Router(ccr)不断出现,作为把 Claude Code 接到免费或更便宜模型的办法。而 MCP 已是标配,是上面几乎每一个正经工作流底下的连接组织。
NotebookLM 和 Obsidian 是这一轮的黑马组合,作为"研究流水线"反复与 Claude Code 配对出现:NotebookLM 吃源料,Obsidian 记住决策,Claude Code 调度任务。Codex 仍是恒定的对比对象兼副驾(很多人 Claude Code 和 Codex 并排开)。Cursor 通篇仍在出现,不过有好几条帖子提到开发者正回落到裸用 Claude Code。Hermes Agent 反复作为本地 agent 的远程/cron 搭档登场。Supabase 和 Vercel 是那批"四周搭一个完整 App/社交网络"帖子里默认的后端与部署栈。Ollama 锚定本地模型运动(把 Claude Code 指向本地模型,零 API 成本)。Claude Code Router(ccr)不断出现,作为把 Claude Code 接到免费或更便宜模型的办法。而 MCP 已是标配,是上面几乎每一个正经工作流底下的连接组织。
评论