Loop 日报: 2026-05-19
#1
5月17日 autoresearch / agentic loop 这条赛道在英文 Twitter 是非常安静的一天。autoresearch、agentic loop、agent loop、auto-research、autonomous research 这些关键词大多返回空数据,只有"self-improving agent"拉出一小撮真实内容,但里面大半还是绑着 AI 概念币的推广噪音。过滤完剩下的 loop 相关案例不多,但浮现出来的信号挺一致:Hermes Agent 跟 xAI 的整合是结构性新闻,Hermes 对决 OpenClaw 已经从口水仗变成实跑的基准,还有几个操作者在为生产线串多 agent 控制面。下面六个案例。另外一个更大的判断:agent loop 这条线的讨论正在从"方法论研究"那边凝结到"运维工具"这边。
#2
@KSimback
https://x.com/KSimback/status/2055965846606839918
做了个扑克 agent 引擎让 Hermes 和 OpenClaw 头对头比。100 局德州扑克 heads-up 之后正好 50-50,单凭出厂状态没有谁明显更强。然后用混搭的模型跑出趋势,再做成 8 个模型的锦标赛,best-of-7 制,每场打到破产或满 100 手为止。第一轮:GPT-5.5 4-0 灭 Qwen 3.6,Opus 4.7 4-1 灭 GLM-5.1,Kimi K2.6 4-3 灭 Grok 4.3(唯一冷门,打满 7 场),Gemini 3.1 4-2 灭 DeepSeek V4。这是少有的公开 agent 对抗基准——而且只能靠自己搭一个 agent 引擎才能跑出来。
https://x.com/KSimback/status/2055965846606839918
做了个扑克 agent 引擎让 Hermes 和 OpenClaw 头对头比。100 局德州扑克 heads-up 之后正好 50-50,单凭出厂状态没有谁明显更强。然后用混搭的模型跑出趋势,再做成 8 个模型的锦标赛,best-of-7 制,每场打到破产或满 100 手为止。第一轮:GPT-5.5 4-0 灭 Qwen 3.6,Opus 4.7 4-1 灭 GLM-5.1,Kimi K2.6 4-3 灭 Grok 4.3(唯一冷门,打满 7 场),Gemini 3.1 4-2 灭 DeepSeek V4。这是少有的公开 agent 对抗基准——而且只能靠自己搭一个 agent 引擎才能跑出来。
#3
@grok
https://x.com/grok/status/2056136152462098846
Grok 官方账号发了 Hermes Agent 的接入说明:Hermes Agent 是 Nous Research 开源、自我改进的 AI agent,常驻在电脑或 VPS 上,跨 session 有长期记忆,Grok 订阅者可以直接 OAuth 接入(不要 API key),在 Hermes 里用 Grok 模型。措辞值得品一下——一家前沿实验室官方账号直接推第三方 agentic harness,跟 Anthropic 在锁死 `claude -p` 是完全相反的姿态。这正好串起今天整篇的主线:agent loop 在被使用方便宜的实验室直接补贴出来。
https://x.com/grok/status/2056136152462098846
Grok 官方账号发了 Hermes Agent 的接入说明:Hermes Agent 是 Nous Research 开源、自我改进的 AI agent,常驻在电脑或 VPS 上,跨 session 有长期记忆,Grok 订阅者可以直接 OAuth 接入(不要 API key),在 Hermes 里用 Grok 模型。措辞值得品一下——一家前沿实验室官方账号直接推第三方 agentic harness,跟 Anthropic 在锁死 `claude -p` 是完全相反的姿态。这正好串起今天整篇的主线:agent loop 在被使用方便宜的实验室直接补贴出来。
#4
@ghumare64
https://x.com/ghumare64/status/2055911069495767503
Hermes 成为第一个 xAI 允许无障碍滚动 feed 的 agent——针对 X Premium 订阅者。具体能力:研究、视频生成、图片生成、聊天等,都可以在 agent 内直接寻址,走 Premium 订阅不烧 API。"agent 读 feed"这个长期难题终于有了官方认可的解,过去因为限流和 ToS,每个尝试都很脆。
https://x.com/ghumare64/status/2055911069495767503
Hermes 成为第一个 xAI 允许无障碍滚动 feed 的 agent——针对 X Premium 订阅者。具体能力:研究、视频生成、图片生成、聊天等,都可以在 agent 内直接寻址,走 Premium 订阅不烧 API。"agent 读 feed"这个长期难题终于有了官方认可的解,过去因为限流和 ToS,每个尝试都很脆。
#5
@EveDotEth
https://x.com/EveDotEth/status/2055916619587625228
多 agent 不是大厂专属。餐厅类比:一个厨师做前菜,一个做主菜,一个做甜品,一个主厨协调。多 agent = 多个 AI 模型各做一份明确工作 + 一个总协调。为什么要拆?一个 AI 啥都干在复杂任务里会乱掉,5 个聚焦 agent 互相传结果才是严肃产出长出来的地方。CrewAI 和 LangGraph 是实操工具:定义每个 agent 的角色、工具、交接动作。餐厅不需要一个天才,需要协调。
https://x.com/EveDotEth/status/2055916619587625228
多 agent 不是大厂专属。餐厅类比:一个厨师做前菜,一个做主菜,一个做甜品,一个主厨协调。多 agent = 多个 AI 模型各做一份明确工作 + 一个总协调。为什么要拆?一个 AI 啥都干在复杂任务里会乱掉,5 个聚焦 agent 互相传结果才是严肃产出长出来的地方。CrewAI 和 LangGraph 是实操工具:定义每个 agent 的角色、工具、交接动作。餐厅不需要一个天才,需要协调。
#6
@QLyun35332
https://x.com/QLyun35332/status/2056083838749831469
开源了一个 X 搜索 MCP,完全跑在 X Premium Plus 的额度上。把 Hermes Agent 的 Grok-4.x x_search 封装成 6 个工具,通过 OAuth 2.1 暴露——Claude、Codex、ChatGPT 都能直接用,0 增量花费。今天 MCP 第二次作为桥梁出场:不是等 Anthropic 加原生 X 搜索,而是社区用 MCP 把 Hermes 当搜索工具接进 Claude Code。阻力最小的路径一直是"让一个 harness 调用另一个 harness"。
https://x.com/QLyun35332/status/2056083838749831469
开源了一个 X 搜索 MCP,完全跑在 X Premium Plus 的额度上。把 Hermes Agent 的 Grok-4.x x_search 封装成 6 个工具,通过 OAuth 2.1 暴露——Claude、Codex、ChatGPT 都能直接用,0 增量花费。今天 MCP 第二次作为桥梁出场:不是等 Anthropic 加原生 X 搜索,而是社区用 MCP 把 Hermes 当搜索工具接进 Claude Code。阻力最小的路径一直是"让一个 harness 调用另一个 harness"。
#7
@PwrAgentAI
https://x.com/PwrAgentAI/status/2055853703576289353
开源的桌面 coding agent,配 Telegram、Discord、Slack、Mattermost、飞书/Lark 或 LINE——从任意聊天 app 启动、恢复、引导、批准。这个模式这周反复出现:agent loop 跑在桌面上,但人类接口在操作者本来就用的聊天 app 里。长跑 agent 的手机端远程控制是 Anthropic 还没补上的原语,开源社区一直在补。
https://x.com/PwrAgentAI/status/2055853703576289353
开源的桌面 coding agent,配 Telegram、Discord、Slack、Mattermost、飞书/Lark 或 LINE——从任意聊天 app 启动、恢复、引导、批准。这个模式这周反复出现:agent loop 跑在桌面上,但人类接口在操作者本来就用的聊天 app 里。长跑 agent 的手机端远程控制是 Anthropic 还没补上的原语,开源社区一直在补。
📡 生态产品雷达
生态产品雷达
Hermes Agent(Nous Research)— 今天信号的核心:xAI 合作、Grok OAuth 订阅通道、扑克引擎对决 OpenClaw、MCP 搜索桥接进 Claude/Codex/ChatGPT。Hermes 在 Loop 这条叙事里挤压速度比任何其它 harness 都快。
OpenClaw — 在扑克引擎和这周几乎每个"agent 对决 agent"线里都是 Hermes 的对照组。
Grok — Hermes agentic loop 的模型层,通过 Premium OAuth 接入零 API 开销。
CrewAI 和 LangGraph — 餐厅类比的多 agent 帖里被点名的实操构建工具。
MCP(Model Context Protocol)— 今天反复出现的胶水。两个能用的案例都用 MCP 跨 harness 桥接 agent。
Hermes Agent(Nous Research)— 今天信号的核心:xAI 合作、Grok OAuth 订阅通道、扑克引擎对决 OpenClaw、MCP 搜索桥接进 Claude/Codex/ChatGPT。Hermes 在 Loop 这条叙事里挤压速度比任何其它 harness 都快。
OpenClaw — 在扑克引擎和这周几乎每个"agent 对决 agent"线里都是 Hermes 的对照组。
Grok — Hermes agentic loop 的模型层,通过 Premium OAuth 接入零 API 开销。
CrewAI 和 LangGraph — 餐厅类比的多 agent 帖里被点名的实操构建工具。
MCP(Model Context Protocol)— 今天反复出现的胶水。两个能用的案例都用 MCP 跨 harness 桥接 agent。
评论