2026年6月1日Open Source Agents Benchmark

Supermemory 把 agent 记忆 benchmark 拿下来了

Supermemory 今天上 GitHub trending，23.3k 星，原因是他们把三个定义 agent 记忆的 benchmark 都拿下了：LoCoMo 第一、ConvoMem 第一、LongMemEval 85.4%。MIT 许可，生产量下检索 300 毫秒以内，通过 MCP 接 Claude Desktop、Cursor、VS Code。他们贴了对比：Mem0、Zep、Letta、SuperLocalMemory 都在身后。

退一步看。Agent 记忆这场仗打了一年——Mem0 融资了，Zep 融资了，cognee 有社区，Letta 开源了，Hippo 被报道过，Anthropic 自己出了 context API。之前大家吵的都是 API 形态和工程性，因为没人在数字上真的拉开。现在有人拉开了。单 session 检索 92.3%、知识更新 89.7%、时间推理 82.0%。这种数据差距上，话题从「哪个适合我的栈」变成「为什么我不用赢家那个」。

主线是：记忆正在变成 agent 租用的一层，不是自己造的。半年前认真做 agent 的团队都在自己写「向量库加摘要循环」，因为现成的打不过你一个周末撸的。这扇窗在关。一旦一个开源记忆引擎可衡量地赢了，除了前沿实验室之外所有人那道「自造还是买」的算术题就翻面了。

看后续。这个 benchmark 王座抗不抗后浪（MemMachine 刚发了 gpt-4.1-mini 上 LoCoMo 0.9169）。哪个 agent 框架会不会把 Supermemory 设为默认，把「自己接记忆」那个时代给业余玩家关掉。还有闭源竞争者（Mem0、Zep）是出自己的 benchmark 反击，还是开始悄悄掉客户。

https://github.com/supermemoryai/supermemory

← 上一篇

Asana 7500 万吃下 StackAI，赌的是 agent 时代的工作流操作系统

minWM 把视频世界模型开源了

← 返回所有文章

加载中...

Supermemory 把 agent 记忆 benchmark 拿下来了

相关文章

评论