2026年6月8日Research Infrastructure Agents

Agent记忆终于有了第一篇正经的系统论文

一个领域开始成熟的信号是这样的：这周arXiv一口气冒出至少六篇讲agent记忆的论文。图记忆、重建式记忆、执行状态记忆、可信记忆检索、记忆什么时候该闭嘴。学术界正式注意到了，agent到底记住什么、怎么记，是个悬而未决的问题。这一批里最该先读的，是斯坦福、MIT、鲁汶大学几个人合写的那篇偏综述的系统论文。

《Agent Memory: Characterization and System Implications》干了一件之前没人愿意干的事：真的去测量agent记忆到底花多少成本。他们做了个分阶段的profiler，把账单拆成三段，构建记忆、检索记忆、用记忆生成，然后把十个有代表性的记忆系统挨个跑了一遍。最关键的发现是：不同的设计会悄悄把成本在写得重和读得重之间挪来挪去，而大多数人选记忆系统的时候，根本不知道自己买的是这个权衡的哪一头。

最后他们给出一个四轴分类法和十条具体建议，涵盖调度、查询摊销、新鲜度和延迟的取舍、以及车队级管理。如果你一直在围观这一串记忆产品，Supermemory、Walrus、MemPalace、Universal Memory Protocol，这篇论文给了你一套能横向比较它们的词汇，而不是凭感觉。

更大的故事藏在这一批论文里。agent记忆在差不多一个季度里，从一个外挂功能变成了有自己benchmark和系统文献的研究子领域。这种事，通常发生在某样东西即将被标准化之前。arxiv.org/abs/2606.06448

← 上一篇

turbovec：把向量索引的训练步骤直接砍掉

一个会自己修工具箱的agent，连打分员都不用

← 返回所有文章

加载中...

Agent记忆终于有了第一篇正经的系统论文

相关文章

评论