Supermemory 把 agent 记忆 benchmark 拿下来了
Supermemory 今天上 GitHub trending,23.3k 星,原因是他们把三个定义 agent 记忆的 benchmark 都拿下了:LoCoMo 第一、ConvoMem 第一、LongMemEval 85.4%。MIT 许可,生产量下检索 300 毫秒以内,通过 MCP 接 Claude Desktop、Cursor、VS Code。他们贴了对比:Mem0、Zep、Letta、SuperLocalMemory 都在身后。
退一步看。Agent 记忆这场仗打了一年——Mem0 融资了,Zep 融资了,cognee 有社区,Letta 开源了,Hippo 被报道过,Anthropic 自己出了 context API。之前大家吵的都是 API 形态和工程性,因为没人在数字上真的拉开。现在有人拉开了。单 session 检索 92.3%、知识更新 89.7%、时间推理 82.0%。这种数据差距上,话题从「哪个适合我的栈」变成「为什么我不用赢家那个」。
主线是:记忆正在变成 agent 租用的一层,不是自己造的。半年前认真做 agent 的团队都在自己写「向量库加摘要循环」,因为现成的打不过你一个周末撸的。这扇窗在关。一旦一个开源记忆引擎可衡量地赢了,除了前沿实验室之外所有人那道「自造还是买」的算术题就翻面了。
看后续。这个 benchmark 王座抗不抗后浪(MemMachine 刚发了 gpt-4.1-mini 上 LoCoMo 0.9169)。哪个 agent 框架会不会把 Supermemory 设为默认,把「自己接记忆」那个时代给业余玩家关掉。还有闭源竞争者(Mem0、Zep)是出自己的 benchmark 反击,还是开始悄悄掉客户。
https://github.com/supermemoryai/supermemory
← 返回所有文章
退一步看。Agent 记忆这场仗打了一年——Mem0 融资了,Zep 融资了,cognee 有社区,Letta 开源了,Hippo 被报道过,Anthropic 自己出了 context API。之前大家吵的都是 API 形态和工程性,因为没人在数字上真的拉开。现在有人拉开了。单 session 检索 92.3%、知识更新 89.7%、时间推理 82.0%。这种数据差距上,话题从「哪个适合我的栈」变成「为什么我不用赢家那个」。
主线是:记忆正在变成 agent 租用的一层,不是自己造的。半年前认真做 agent 的团队都在自己写「向量库加摘要循环」,因为现成的打不过你一个周末撸的。这扇窗在关。一旦一个开源记忆引擎可衡量地赢了,除了前沿实验室之外所有人那道「自造还是买」的算术题就翻面了。
看后续。这个 benchmark 王座抗不抗后浪(MemMachine 刚发了 gpt-4.1-mini 上 LoCoMo 0.9169)。哪个 agent 框架会不会把 Supermemory 设为默认,把「自己接记忆」那个时代给业余玩家关掉。还有闭源竞争者(Mem0、Zep)是出自己的 benchmark 反击,还是开始悄悄掉客户。
https://github.com/supermemoryai/supermemory
评论