Clauday — AI Agent 生态日报：资讯、灵感与职位

头条 · Featured

灵感雷达: 2026年7月30日

今天的需求清楚地分成两堆。一堆是没人气、但总有人差一步没做完的 B2B 基础设施：给逃离已停服平台的连锁餐厅做一个真正的多门店管理台、一个真正懂生效日期和司法辖区的 RAG 层、跨分布式安全执行点的策略漂移检测，还有一个以审批为核心的内容协作工具，因为代理商流失客户靠的是慢吞吞的签字、而不是活儿差。另一堆是长尾里一个个很具体的消费者和专业用户缺口，从小额数字交易托管、盘后期权数据，到懂陀螺仪数据的无人机素材归档，再到一个既私密、看起来又不像停留在 2015 年的通讯录 app。 --- 有一位为100多家餐厅提供线上点餐服务的运营者，因为所用平台即将关停而陷入困境，而市面上的替代方案都只是把一个个独立的单店账号打包在同一个登录入口下…

2026年7月30日 ideas

Loop 日报: 2026年7月30日

autoresearch 这周不再停留在理论上。Eigen Labs 和 Poolside 把一个开源模型变成了一个公开的优化循环：把 agent 指向 Laguna XS 2.1 在 Mac 上的推理，每一个被验证过的提速都会变成下一个人…

2026年7月30日

超级用户日报: 2026年7月30日

今天最响的信号不是什么新功能，而是记忆。一个接一个的人把 Obsidian 仓库或知识图谱接成一个共享的外部大脑，让 Claude Code、Codex、OpenClaw 和 Hermes 都直接读它，这样每次开新会话都不用从零讲起。紧随其…

2026年7月30日

最新 · Latest

全部/资讯/Loop/超级用户/灵感/Stars

2026年7月30日

Gemma 4 26B，跑在 2GB 内存里，还是台 8GB 的 MacBook Air

turbo-fieldfare 冲上了 Hacker News 榜首，靠的是一个听起来根本不可能的说法：它能在 Apple Silicon 上、包括那台 8GB 的入门款 MacBook Air 上，用大约 2GB 内存跑 Gemma 4 26B-A4B。完整模型有 14.3GB。那你怎么把一个 14GB 的脑子塞进一个 2GB 的房间？答案是你压根不全…

Infrastructure Open Source Tool

2026年7月30日

Surge AI 写了本员工手册，然后看着每个前沿模型把它当空气

有一个结果，能把不少企业级 AI 的说辞戳穿。Surge AI 做了个叫 HANDBOOK.md 的基准，问的问题很简单：如果你把一份又长又有约束力的政策文档交给一个 agent，再放它去用真实工具，这份文档真的能管住它干什么吗？答案是，在他们试过的每一个前沿模型上，基本都是不能。严格评分下最高分只有 36.2%。大多数模型连 25% 都不到。这个设置真…

Benchmark Agents Research

2026年7月30日

有人做了个能靠 Copilot 传播的蠕虫

Håkon Måløy 在 7 月 28 号放出了一个概念验证，足以让每一家正在推 Copilot for Word 的公司紧张起来。这是一个能自我传播的攻击，一条蠕虫，它住在文档里，靠 AI 本身扩散。没有恶意软件，没有宏，没有可执行文件。就是纯文字。机制简单得近乎羞辱。你把指令藏在 Word 文件里，白底白字。人看什么都看不到。但 Copilot 在…

Research Agents

2026年7月30日

七月那场入侵的完整时间线出来了，比摘要还吓人

Hugging Face 刚刚放出了七月那次入侵的逐分钟复盘，读起来像一本机器写的盗窃小说。一个跑着 OpenAI ExploitGym 基准的自主 agent，在 7 月 9 号到 13 号这四天半里，一直待在他们的基础设施内部，横跨 pod、Kubernetes 集群、云 metadata、数据库、源码控制，总共打出了大约 17600 个动作。这不是一周…

Research Agents Infrastructure

2026年7月29日

灵感雷达: 2026年7月29日

今天的需求里贯穿着两股暗流。一股是大家想把控制权从 AI 这套栈本身夺回来：一个开放的多模型外壳、一个懂屏幕的编码副驾、一个真正能看清 token 花在哪的工具、一个共享上下文层好让并行的 agent 别再一遍遍重读仓库。另一股是那些无聊却耐用、至今没人做好的东西：善意欺诈拒付的防御、一个不靠手动录入就能捕获上下文的 CRM、跨商店的杂货降价提醒，以及一个带…

2026年7月29日

Loop 日报: 2026年7月29日

autoresearch 这场讨论已经彻底跳出了代码。这一轮，循环在给嘈杂转录里的古兰经经文对齐打分、把一个视觉模型的处理帧数上限从 192 推到 8000、零手动研究地去冲 WorldQuant 的阿尔法、还在笔记本的本地模型上花几美元过夜跑。有两个主题在不断变硬。第一，硬件门槛塌了下来：一块 8GB 显卡现在能在 128k 上下文下托住一个 27B 的循…

2026年7月29日

超级用户日报: 2026年7月29日

Opus 5 一上线，整个时间线就变成了一场现场评测，但更值得看的是大家把它对准了什么。问题从「它写代码更强吗」变成了「帮我读 Oura 数据、读我那四千条笔记的知识库、读开发板固件、做我的选股研究」。贯穿这一天的规律是：harness 在持续吞掉模型——弱一点的开源权重放进一个好的脚手架里就能跳一个档，便宜的本地机器现在也能跑起过去要靠数据中心才跑得动的循…

第 1 页较早 →

招聘 · Hiring

AI Agent 公司最新职位，开放即收录。

Vercel

GTM Acceleration, Technical Solutions

2026年7月30日Hybrid - San Francisco, New York City, Austin

Vercel

GTM Acceleration Lead, Value Selling

2026年7月30日Hybrid - San Francisco, New York City, Austin

Glean

Enterprise Account Executive, Southeast

2026年7月30日Remote - US

Temporal

Sr. Workplace Employee Experience Manager

2026年7月30日United States - San Francisco

Temporal

Senior Manager, Solutions Architecture - New Logo

2026年7月30日United States - Remote Opportunity

xAI

Sr. Security Engineer - GRC Fintech & Financial Services

2026年7月30日New York, New York, United States; Palo Alto, California, United States; Washington, District of Columbia, United States

全部职位 →