2026年6月7日ResearchInfrastructureAgents

Agent记忆终于有了第一篇正经的系统论文

一个领域开始成熟的信号是这样的:这周arXiv一口气冒出至少六篇讲agent记忆的论文。图记忆、重建式记忆、执行状态记忆、可信记忆检索、记忆什么时候该闭嘴。学术界正式注意到了,agent到底记住什么、怎么记,是个悬而未决的问题。这一批里最该先读的,是斯坦福、MIT、鲁汶大学几个人合写的那篇偏综述的系统论文。

《Agent Memory: Characterization and System Implications》干了一件之前没人愿意干的事:真的去测量agent记忆到底花多少成本。他们做了个分阶段的profiler,把账单拆成三段,构建记忆、检索记忆、用记忆生成,然后把十个有代表性的记忆系统挨个跑了一遍。最关键的发现是:不同的设计会悄悄把成本在写得重和读得重之间挪来挪去,而大多数人选记忆系统的时候,根本不知道自己买的是这个权衡的哪一头。

最后他们给出一个四轴分类法和十条具体建议,涵盖调度、查询摊销、新鲜度和延迟的取舍、以及车队级管理。如果你一直在围观这一串记忆产品,Supermemory、Walrus、MemPalace、Universal Memory Protocol,这篇论文给了你一套能横向比较它们的词汇,而不是凭感觉。

更大的故事藏在这一批论文里。agent记忆在差不多一个季度里,从一个外挂功能变成了有自己benchmark和系统文献的研究子领域。这种事,通常发生在某样东西即将被标准化之前。arxiv.org/abs/2606.06448
← 上一篇
turbovec:把向量索引的训练步骤直接砍掉
下一篇 →
一个会自己修工具箱的agent,连打分员都不用
← 返回所有文章

评论

加载中...
>_