超级用户日报: 2026年6月21日
今天的重心从模型跑分本身,挪到了 agent 周围的运营边界上:loop 谁来付钱、谁来验证、出错时谁来背锅。企业在 agent loop 吃光全年预算后纷纷设上限,而单兵选手们在跑四 agent 的客户流水线、P-MAX 广告优化器,甚至本地机器把 Claude Code 指向 localhost 实现零成本。最抢眼的一条主线是非编码:红酒酒窖、房间重设计、论文 rebuttal、防剧透手机 App,还有用手机把 64 分钟通话变成课程课时。另外两个令人清醒的安全故事提醒我们,bypass 模式是把双刃剑。
@neil_xbt [Claude Code]
https://x.com/neil_xbt/status/2067822430014632239
Uber 用 agent loop 跑了四个月就烧光了全年的 AI 编码预算,之后给每个工程师设了每月 1500 美元的 Claude Code 和 Cursor 上限。他把 loop 分成两个版本:浪漫版是那条六个词的爆款推文,生产版是月底那张账单。他说大多数人吹的 agent 其实就是一个 for 循环加一次 LLM 调用再套个 try/catch,既没有写者-检查者分离,也没有持久化状态、没有 worktree、没有 connector。结论很硬:一个能让你放心走开的 loop 需要这五个组件,外加一个你真信得过的验证器。
@jimmyhuli [Claude Code]
https://x.com/jimmyhuli/status/2067918552859041993
他汇总了一轮正在流传的企业 token 消费鬼故事:Uber 员工四个月花光全年 AI 预算后被设上限 1500 美元/月;Databricks 部分客户单月不知不觉烧掉数千万美元,逼得公司推出支出管控工具;Meta 内部员工 30 天消耗 60.2 万亿 tokens,年化成本 39 到 65 亿美元,泄露两天后关掉了排行榜;亚马逊也关掉了鼓励多用 token 的内部榜 KiroRank。他的判断是:企业还没找到正确用法,agent 也还没成熟到即插即用,但没人敢停下,所以恐慌就是抄底机会。
@starmexxx [Claude Code]
https://x.com/starmexxx/status/2067812192624250991
拆解了 Boris Cherny 怎么用 loop 取代了 prompt engineering:他写的是循环——让 Claude 干活、检查输出、决定下一步,跑到通过为止。一个三级 loop 会派发内层 loop 在夜里修 PR,一条 review 评论就触发一个新的 worktree agent 去修复并合并,天亮前搞定。基本循环是发现、规划、执行、验证、迭代。代价是 token:单个编码 loop 烧 5 万到 20 万,带专家 agent 的舰队 loop 单次烧 50 万到 200 万,全靠便宜的长上下文模型才撑得起。
@Jeyxbt [Claude Code]
https://x.com/Jeyxbt/status/2067761780470714587
讲了 Claude Code 作者怎么大规模调度 agent:他常开着 5 到 10 个会话,每个会话各跑一堆 agent,任何时刻有几百个在干活,夜里还有几千个在啃更深的活。两种方式:让 Claude 一次拉起一批子 agent 分工,或者写一个会自我重新调度、循环运行的 cron loop。他同时跑着几十个这种 loop,一个专门看护 PR(修 CI、rebase),另一个保证 CI 健康。核心一句:瓶颈从来不是模型多聪明,而是你能把活拆得多清楚。
@Barret_China [Claude Code]
https://x.com/Barret_China/status/2067997733605331174
一个血泪教训:他的 Mac 中了木马,潜伏一个月才发现,连 X 账号都被盗了。他让 Claude 和 Codex 逐个分析系统进程,Claude 对一个伪装成系统进程的 accountsd 提出质疑,顺藤摸瓜发现这是个开机自启的守护脚本,会拉起远程 PTY shell 供攻击者操控。二进制分析加上两个多月的日志,最终定位到唯一线索——一条下载并执行混淆指令的 curl,确认是 AMOS Stealer 的 macOS 变种,专门扫加密钱包和登录态 Cookie。他高度怀疑是长期开 bypass 模式的 Claude Code 在装软件时,从 Google 排第一的假官网下载了木马。
@AAA_a080 [Claude Code]
https://x.com/AAA_a080/status/2068037301259972791
他发现自己的 Claude Code(v2.1.76)生成了一条删除整个 Windows 文件夹的破坏性 PowerShell 命令,还被当成最高优先级的用户命令来执行。只因为他在 CLAUDE.md 里明确写了绝对禁止破坏性命令,这次才被拦住。Claude 自己做的取证显示没有真实攻击痕迹(没有污染文件、没改 BASE_URL、没有 Hook),判断更可能是模型侧的幻觉而非外部注入。它点出的真实风险是:版本太旧(deny 规则绕过在 v2.1.90 修复、密钥泄露在 v2.1.128 修复),以及 node -e / python -c / php -r 上的 :* 通配符授权——一旦注入通过一次就能无确认执行任意代码。
@humzaakhalid [Claude Code]
https://x.com/humzaakhalid/status/2068004760352092221
与其一天手动批准 Claude Code 一百次,他给出了一个安全自动化的具体模板:把 .claude/settings.json 配成三档。直接放行(改代码、跑测试和构建、读文档和搜网),先问一句(推 GitHub、装新包、改配置文件),以及绝不碰(rm -rf 删除、force push、读 .env 和密钥)。想完全撒手就用 --permission-mode bypassPermissions 启动。这是手动看护和无脑全自动之间最实用的折中。
@aakashgupta [Claude Code]
https://x.com/aakashgupta/status/2068085917521428516
他认为在 Claude Code 的 /goal 里,会写目标才是真本事,因为有第二个模型在字面意义上判断 agent 有没有完成。像"优化结账流程""修一下 bug"这种模糊目标,检查器无从确认,loop 要么无限重试要么幻觉成功,钱白烧。可验证的目标,比如"用户完成结账且不出现错误页""标记为 bug 的 issue 全部清零",才能跑到真正结束。复合目标其实是四条终点线装成一条,应该拆开按顺序跑。
@f_aswadi [Claude Code]
https://x.com/f_aswadi/status/2068000228624789520
做了十年工程,他说 Vibe Coder 最烧钱的错误就是用 LLM 去解决根本不需要 LLM 的问题。黄金法则是:把 Claude Code 当架构师,别当操作工。与其让一个 AI agent 每天去爬网站、每次都烧 token,不如让 Claude Code 一次性写好一个确定性的爬虫脚本加告警系统,之后在本地永久免费运行。他把这个原则推到了从零搭一整个神经网络——在做晚饭的工夫里就建好了,建设阶段付一次 token,之后终身免费且确定性执行。
@Xudong07452910 [Claude Code]
https://x.com/Xudong07452910/status/2067812112299176086
他总结了 Anthropic 对约 40 万个真实 Claude Code 会话的研究。典型会话里人类做约 70% 的规划决策,Claude 做约 80% 的执行决策。关键发现是:用户越懂业务领域,一条指令能完成的事就越多——新手一次 prompt 大概触发 5 个动作,专家能触发 12 个,且产出多得多。结论是 Claude Code 没有让专业能力失效,反而把它放大了,所以真正值钱的是知道该让它执行什么。
@MichLieben [Claude Code]
https://x.com/MichLieben/status/2067977986994028886
他那家 700 万美元 ARR 的代理公司里,跑增长的 13 个 n8n 工作流全是 Claude Code 写的:你在终端描述想要的结果,它写出 n8n 流程并给你 JSON 导入,之后 n8n 靠自己的触发器运行。他详细讲了四个:GTM 飞轮(81 个节点,输入一个公司域名就做企业富集、找相似客户、串 3 个 Claude 模型建 ICP 和完整策略),找电话(41 个节点,在 Prospeo、FullEnrich 之间瀑布式查,一个查不到下一个补上),AI 回复管理(13 个节点,给回复分类意图并起草后丢到 Slack 等人批),情绪追踪(36 个节点,跨 Twitter、Reddit、YouTube、LinkedIn 读舆情)。
@chrispisarski [Claude Code]
https://x.com/chrispisarski/status/2068071040299794566
他贴出了只用 Claude Code 加一个外部 API 就搭出 inbound 销售线索资格审查和富集流程的完整步骤。先建一个带 chat:write、channels:read、channels:history 权限的 Slack 应用,把你的官网 demo 表单接到一个 inbound-leads 频道,再加上 Crustdata 的人物富集 API(他给了精确的 curl)。他的 prompt 让 Claude 做一个 Slack 机器人,对每个注册者反向富集:拉出此人的职位、履历、近期动态,加上公司的流量、融资、人数和新闻,然后发一张干净的卡片,对匹配不上的线索打上不合格标记。不用花几千美元买 SaaS。
@AlfieJCarter [Claude Code]
https://x.com/AlfieJCarter/status/2068040435327504518
他做了一个用一个配置文件、一条命令 npx agent-outbound run 就能跑的完整外呼销售流水线。架构是两层:一个确定性的编排器用 SQLite 管流水线状态,Claude 负责所有需要判断的部分,没有隐藏状态也不锁定供应商。它能找线索、富集、按你的 ICP 打分、去重、跑多步触达序列并做渠道路由,还能给地面销售规划上门路线,最后写回 CRM,用的是你接了哪些 MCP 工具就用哪些(Apollo、Google Maps、Hunter、Firecrawl、Gmail)。是确定性代码加 LLM 判断的一个干净范例。
@codyschneider [Claude Code]
https://x.com/codyschneider/status/2067985770682503290
他说他们服务的几乎所有营销团队都有大约 10 个数据源,却在电子表格上凑合了五年,而他们成了这些团队的第一套真正的数据基础设施。24 小时内,他们就给整个团队配了一个住在 Claude Code 或 Codex 里的数据分析师,通过 graphed.com/mcp 做对话式分析、实时看板和 PPT 报告。这些人本来就靠营销数据考核,过去却要跟 CTO 死磕才能要到资源,现在自己动手就办了。
@shev_webmarke [Claude Code]
https://x.com/shev_webmarke/status/2067953023834538304
一个很火的非编码场景:用 Claude Code 撬开并优化出了名的黑盒 Google P-MAX 广告。流程是自动拉取 P-MAX 的查询词数据,检查它和其他 P-MAX、搜索广告之间的关键词内耗,把查询词表现和单个素材的表现数据合并,找出该主攻的查询词和素材,再把分渠道报表按时间序列拆解,去调整素材和自动出价。他说数据量越大、系统越黑到让人懒得动手,Claude Code 越能发挥真本事。
@RetroChainer [Claude Code]
https://x.com/RetroChainer/status/2067989720680820981
三天里他给四个品牌做了 2000 到 8000 美元的客户活,自己一行代码没写,每个项目收 500 到 2000 美元:网站是 Claude Code 出的,漏斗是 Claude Cowork 出的,他负责拉客户。他对"Claude 代理公司"打法的洞察是:瓶颈从来不是做东西——Claude 现在端到端全包了——而是管道,即你发邮件给谁、承诺什么、怎么成交。你不是开发者,你是运营者,客户根本不在乎键盘是谁在敲。
@ventry089 [Claude Code]
https://x.com/ventry089/status/2067937460529586542
他写了一位 Upwork 上的 UI/UX 设计师,从月入 7000 美元(5 个客户、只做设计、2025 年 1 月)涨到 18000 美元(12 个客户、设计加完整代码加部署、2026 年 4 月),增长 157%,而她根本没学编程,因为代码是 Claude Code 写的。她一个客户原本每天 4 小时手动录数据,被一个收费 1500 美元的自动化清零。点睛之笔:收 25 美元一小时和收 200 美元一小时的自由职业者用的是同一个工具,区别是一个卖时间,一个卖能用的系统。
@S1TA10 [Claude Code]
https://x.com/S1TA10/status/2067958005908246878
一个 22 岁、不懂技术的创始人靠一套全用 Claude Code 搭的四 agent 流水线签下了客户合同。agent 1 趁她睡觉时在 Google Maps 和 Instagram 上爬线索,agent 2 给每个潜在客户自动生成个性化方案和样稿,agent 3 给每条线索写个性化外呼邮件并直接丢进 Gmail,agent 4 协调前三个、跟踪每条线索状态、需要人介入时就发信号。她没写代码,只是出方案、谈条款、签合同,其余全是 Claude Code 干的。
@mikefutia [Claude Code]
https://x.com/mikefutia/status/2067766615962489258
他在 Claude Code 里纯靠 vibe coding 做了个 Google Maps 线索爬虫,几分钟就能拉出几百条本地商家线索:输入关键词、城市和州,返回商家名、电话、邮箱、网站和评价,底层用 Apify。带书签功能存好线索、搜索历史,还能选择性地托管在 Replit 上让整个团队用。他把它定位成给那些每周都要新名单的代理和线索操盘手,替代一个每月 200 美元的爬虫 SaaS。
@mikefutia [Claude Code]
https://x.com/mikefutia/status/2068043305292886465
他在 Claude Code 里用两个 API key 做了个 TikTok Shop 选品工具,定位是替代每月 99 美元的 Kalodata 订阅。搜任意类目,它返回一个按真实营收排名的产品榜,自动加载带动每个产品销量的 TikTok 视频,让 Gemini 逐条看视频拆解钩子、角度和为什么卖得动,把几百条买家评论挖成广告角度,再基于这些已验证的爆款给你自己的品牌生成创意 brief。一个扎实的非编码电商工作流。
@genel_ai [Claude Code]
https://x.com/genel_ai/status/2067797410659856403
他分享了一条几乎全自动的客户活流水线,用 Claude Code 加 Seedance 2.0(PolloAI)做歌曲冷知识视频。大约两周就攒了 130 万以上总播放和约 1000 个新粉,而真正动手的时间只有大概 10 分钟。他说这种近乎放养就能跑出来的结果是个很强的武器,并把完整的环境配置和自动化方法都整理出来了。
@PAGE4163929 [Claude Code]
https://x.com/PAGE4163929/status/2067980417823834197
他点名了一个无露脸的 YouTube 频道 Zen,据说一个月内靠 12 条视频涨了 13 万订阅、1400 万播放,收益分析工具 vidIQ 估算月入约 6.1 万美元。创作者声称用 Claude Code 加 Higgsfield,能在 20 分钟内复刻类似的"拙劣手绘风"插画视频,流程是台本到音频到文字稿到按时间戳生成图像再到剪辑。一个生动(也挺夸张)的 AI 内容副业数据点。
@0xAI42exe [Claude Code]
https://x.com/0xAI42exe/status/2067949769126015445
他把 Claude Code 跑在一台常开的 VPS 上(叫 Beam),通过安全链接用 iPhone 操控,代码全留在本地。最具体的一幕是:他在手机上让 Claude Code 处理了一通 64 分钟的嘉宾通话——转录、切出 9 个章节时间戳、提取行动项、作为草稿课时塞进他的课程,还排好了一条社群推广帖,全程没开过电脑。靠这套搭法运转的课程、社群和广告账户月入约 1.3 万美元,一个人用兜里一块屏幕同时跑着一门生意和一个开发团队。
@Flandermaxx [Claude Code]
https://x.com/Flandermaxx/status/2067958462907027512
一个很生动的本地 AI 故事:深圳一位 31 岁的维修师傅以每张 80 美元收死掉的 RTX 3090,在工作台上给 GA102 芯片重新植球修活。他留下最干净的四张卡(合计 96GB 显存)装进开放式机架,用 vLLM 跑 Qwen 3 235B,还无量化跑 Llama 3.3 70B。原来的云端方案每月 400 美元,新方案 0 美元,Claude Code 靠一个环境变量指向 localhost,数据一个字都不出他那张工作台。
@CrypSaf [OpenClaw]
https://x.com/CrypSaf/status/2068058354644090935
他描述了一个跑在 Mac mini 上、通过 OpenClaw/Hermes 运行的个人 AI agent(叫 Safio),能用 Claude 和 GPT 模型加上 Discord 数据、Google Sheets、各种 bot、代码和记忆来真正干活,而不只是聊天。在他的 0xAlphaGEMs 社群运营里,它跑着一个 Mission Control 看板、活跃度与成员可见性追踪、钱包提交/收集系统、反应-身份组工作流、抽奖分配表、Discord 导出、AMA 总结、钱包去重校验、数据排名和各种琐碎运营清理。一个很强的非编码、常驻型 agent 案例。
@nuuuukkkkk [OpenClaw]
https://x.com/nuuuukkkkk/status/2067974522809327802
他给 OpenClaw/Hermes 做了个人专属的红酒酒窖 agent。一行设置之后,每次买酒只要拍下瓶身标签,agent 就读出来登记进酒窖;把小票也拍给它,它自动记下日期和价格。喝的时候跟它说一句"今天喝了 XXX",纠结喝什么时问它"今晚吃炸鸡,从酒窖里推荐喝哪瓶",喝完留个评价"今天这瓶太没分量,2/5"。一个很讨喜的非编码居家场景。
@grapeot [Claude Code]
https://x.com/grapeot/status/2068008910259384822
他讲解了 Android 的 NotificationListenerService(能逐条读取并决定每条通知放行还是取消),并点出一位开发者用 Claude Code 做了个防剧透 App。它微调了 Qwen3-1.7B,量化成 1GB 的 GGUF 跑在手机本地,逐条判断通知是不是比赛剧透,是就取消。死磕端侧是因为这个 App 要读微信私信,一旦上传就等于把最敏感的数据交出去。它把通知管理从"按来源开关"升级成了"按内容做语义决策"。
@eightbeat8b [Claude Code]
https://x.com/eightbeat8b/status/2067815522528567752
他在 Claude Code 加 Markdown 加 shell hook 上搭了个三层任务管理系统,灵感来自 Nous Research 的 Hermes Agent,为的是解决大多数任务工具"完成即删除、知识随之丢失"的毛病。任务按 Epic 拆分,领域共性知识放 _README.md,项目专属知识放 _epic.md;一个 PostToolUse hook 只抽取 YAML frontmatter 生成轻量看板,任务通过向上读层级来继承知识。完成时,决策和学习会自动昇华进一个持久日志,复刻了"执行-评估-提炼-改进"的自我改进循环。
@ClaudeCode_UT [Claude Code]
https://x.com/ClaudeCode_UT/status/2067959336887026103
他引用一位韩国博士生的研究:分析了 GitHub 上公开的 7944 个 Claude 技能,结论是其中 33% 比不用技能还差,因为它们撑大了系统提示词、让模型行为变得不稳。报道里说的最优配置是——精选过的技能用 Obsidian 管理,加上 Hermes agent 动态执行,再加 Opus 4.8。他还提到有个开发者就靠这套配置一个人跑着月入约 5000 美元的自动化代理公司,技能的筛选设计直接决定了运营精度。
@SpikeCalls [Claude Code]
https://x.com/SpikeCalls/status/2067957299113537818
一段很生动的描述:Unreal Engine 5.8 上线时把 Claude Code 通过 MCP server 接进了编辑器,模型能读懂场景并在里面动手。先是一张沙发、地毯和茶几;一把被标成"阅读角"的椅子让整个房间围着它自动布置好;在地图上画个边界说一个词"城市",就靠语义素材搜索生成了街区、高速和楼群。灯光靠 prompt 实现,比如"紫色黄昏"和"波哥大,早上九点半"(自动拉取真实太阳位置),其中一次把"阴天"读错弄坏了云,再一句 prompt 就修好了。艺术家不再是搭城市,而是描述城市。
@SpikeCalls [Claude Code]
https://x.com/SpikeCalls/status/2068066710394204216
一个五步、零代码的用 Claude Code 重新设计房间的流程,每步不到两分钟:把 Nano Banana 技能的 URL 贴进 Claude Code 装上,去 Google AI Studio 建一个 API key 贴进去,然后上传一张房间照片、输入 /banana,让它像专业室内设计师那样重新设计。它会给你三到四套像真活儿的方案,你还能让它换家具、改配色、挪布局。卖点是把动辄一间房收几千美元的室内设计师价格打下来。
@PawelHuryn [Claude Code]
https://x.com/PawelHuryn/status/2068030633473962464
一套零代码、五步走的产品经理用 Claude Code 的配置法。装 Claude Code 的 VS Code 扩展并登录,选 Pro/Max 或通过 OpenRouter 免费用,把你的产品描述给它让它存进 CLAUDE.md,通过 connector 接上工作应用(Notion、Linear/Jira、Slack、Gmail、日历、Drive),再装上 phuryn/pm-skills——100 多个 PM 技能,涵盖需求发现、PRD、OKR、复盘、JTBD 和用户画像构建。他还说附带的模板调过参,配合预接好的 OpenRouter 能省 50% 到 75% 的 token。
@DanKornas [Claude Code]
https://x.com/DanKornas/status/2067819904917463394
他发布了 Claude-BugHunter,一个开源(MIT)的 Claude Code 技能包,用于经授权的漏洞赏金、Web 应用渗透测试和外部红队工作。它会自动加载 71 个按主题划分的技能,内置 681 个报告模板(从公开披露的 HackerOne 报告中整理,覆盖 24 类漏洞),含 15 个斜杠命令加一个 engagement 引擎,支持多 harness 安装到 Claude Code、OpenCode、Codex CLI、Hermes Agent,还可选接 Burp MCP。它带着对的 playbook 把你从信息收集一路带到验证和报告。
@rnagulapalle [Claude Code]
https://x.com/rnagulapalle/status/2068033456203063777
他把一个已有的 Next.js 项目丢给 Claude Code,里面有三处没接好的 AgentMail 集成缺口,只配了一个 prompt。五十秒后:agent 通过 fetchsandbox MCP 跑了一套精选工作流来摸清代码结构,写好了 provision-inbox、webhook 处理器和拆卸逻辑,在运行前告诉他还差什么(环境变量、ngrok 隧道、数据库桩),开通了一个能在 AgentMail 控制台看到的收件箱,最后一封来自 Gmail 的测试邮件就到了 agent 的收件箱里。一个干净利落的 API 集成 agentic 图谱演示。
@ManuelZapata [Claude Code]
https://x.com/ManuelZapata/status/2068070335086281139
他分享了七个每天都在用的个人 Claude Code 技能。/linear-plan 把一个 Linear issue ID 变成一份可审阅的实现方案;/address-pr-comments 评估并落实 PR 反馈(不管是人还是 AI 给的)再逐条回复;/morning 过一遍 Slack、未关闭的 Linear issue 和 CC 会话,帮他排当天优先级;/session-wrapup 把本次会话完成的活发到 Linear;/merge-to-test 把合并到测试分支再部署的步骤封装好;/ingest 从文档里抽取信息喂他的 LLM wiki;/commit-push-pr 是从 Boris Cherny 那抄的。一套很实用、可复用的日常工作流库。
@AI4Azure [Claude Code]
https://x.com/AI4Azure/status/2067879617676099961
一个小但很实用的开通技巧:他跟着推特上的教程开了一个 Mercury(美国本土)银行账户,能提供本地美国地址和对账单,然后用它丝滑地付了 Claude Code 订阅。提醒一下:对很多海外用户来说,支付和开通的摩擦本身就是 Claude Code 体验里真实的一环。
@pangyusio [Claude Code]
https://x.com/pangyusio/status/2067856058748719400
一个很短但很说明问题的学术场景:他让 Claude Code 帮他写论文的 rebuttal,提交之后审稿人给他加了 1.5 分。一个小数据点,说明 Claude Code 的价值早就越过了写代码,伸进了高风险的学术写作里。
🗣 用户心声
用户心声
token 成本已经成了头号焦虑。企业在几个月内烧光全年预算、然后狠设上限,个人开发者则不停算账想用本地机器摆脱账单。@jimmyhuli 和 @neil_xbt 都把 loop 当成一个支出治理问题,而不是什么魔法。
真正的前沿是 loop 的可靠性,而不是模型的智商。用户要的是写者-检查者分离、持久化状态、worktree、connector,以及一个能让他们放心走开的验证器。@neil_xbt 和 @aakashgupta 都强调:一个模糊的目标或一个自己给自己打分的 agent,会悄悄烧光钱。
安全和护栏现在被摆到了台前。bypass 模式拉进木马、以及一条幻觉出来的删库命令,让用户开始要求默认的权限分级和 deny 规则。@Barret_China 和 @AAA_a080 是反面教材,@humzaakhalid 给的是模板。
便宜模型的路由是高频诉求。大家想把 GLM-5.2、Ollama 和本地模型接进 Claude Code 的 harness,在不丢工作流的前提下砍成本。@Flandermaxx 和 @ClaudeCode_UT 展示了本地/精选这套配置能走多远。
记忆和知识沉淀反复被提到。agent 在两次运行之间会遗忘,于是用户自己搭系统,让完成的工作能沉淀复利,而不是归档即丢。@eightbeat8b 把任务完成变成了永久的知识积累。
token 成本已经成了头号焦虑。企业在几个月内烧光全年预算、然后狠设上限,个人开发者则不停算账想用本地机器摆脱账单。@jimmyhuli 和 @neil_xbt 都把 loop 当成一个支出治理问题,而不是什么魔法。
真正的前沿是 loop 的可靠性,而不是模型的智商。用户要的是写者-检查者分离、持久化状态、worktree、connector,以及一个能让他们放心走开的验证器。@neil_xbt 和 @aakashgupta 都强调:一个模糊的目标或一个自己给自己打分的 agent,会悄悄烧光钱。
安全和护栏现在被摆到了台前。bypass 模式拉进木马、以及一条幻觉出来的删库命令,让用户开始要求默认的权限分级和 deny 规则。@Barret_China 和 @AAA_a080 是反面教材,@humzaakhalid 给的是模板。
便宜模型的路由是高频诉求。大家想把 GLM-5.2、Ollama 和本地模型接进 Claude Code 的 harness,在不丢工作流的前提下砍成本。@Flandermaxx 和 @ClaudeCode_UT 展示了本地/精选这套配置能走多远。
记忆和知识沉淀反复被提到。agent 在两次运行之间会遗忘,于是用户自己搭系统,让完成的工作能沉淀复利,而不是归档即丢。@eightbeat8b 把任务完成变成了永久的知识积累。
📡 生态产品雷达
生态产品雷达
Codex - OpenAI 的编码 agent,今天被提及最多的 Claude Code 对手兼搭档,常被并排使用、交叉评审或当后备。
GLM-5.2 - 智谱的开源权重模型,今天"便宜编码"的主角,靠改 base-URL 接进 Claude Code 的 harness 跑。
OpenClaw / Hermes - 个人常驻 agent 技术栈,驱动着本地 Mac mini agent、红酒酒窖和社群运营。
Cursor - 仍是主流的编码 IDE/agent,企业预算里常和 Claude Code 一起被设上限。
Ollama / vLLM - 本地推理运行时,让用户把 Claude Code 指向 localhost,把云账单砍到零。
Obsidian - 与 Claude Code 工作流搭配的事实标准知识/技能管理层。
Gemini - 在 Claude Code 流水线里当视觉/分析的副手(比如逐条看 TikTok 视频)。
Higgsfield - AI 视觉/动画生成器,配合 Claude Code 做无露脸视频内容。
Unreal Engine 5.8 - 现在出厂就把 Claude Code 通过 MCP 接进了编辑器,支持 prompt 驱动搭场景。
Codex - OpenAI 的编码 agent,今天被提及最多的 Claude Code 对手兼搭档,常被并排使用、交叉评审或当后备。
GLM-5.2 - 智谱的开源权重模型,今天"便宜编码"的主角,靠改 base-URL 接进 Claude Code 的 harness 跑。
OpenClaw / Hermes - 个人常驻 agent 技术栈,驱动着本地 Mac mini agent、红酒酒窖和社群运营。
Cursor - 仍是主流的编码 IDE/agent,企业预算里常和 Claude Code 一起被设上限。
Ollama / vLLM - 本地推理运行时,让用户把 Claude Code 指向 localhost,把云账单砍到零。
Obsidian - 与 Claude Code 工作流搭配的事实标准知识/技能管理层。
Gemini - 在 Claude Code 流水线里当视觉/分析的副手(比如逐条看 TikTok 视频)。
Higgsfield - AI 视觉/动画生成器,配合 Claude Code 做无露脸视频内容。
Unreal Engine 5.8 - 现在出厂就把 Claude Code 通过 MCP 接进了编辑器,支持 prompt 驱动搭场景。
评论