MemPrivacy——在 agent 和云之间塞了一层占位符
MemPrivacy 今天在 HuggingFace Daily Papers 拿了 124 个 upvote。上海 AI Lab 加通义团队。他们解决的问题是每个真做个人 AI 部署的人都会撞上的——你的 agent 需要云端推理,但你的 memory 里有云端不该看到的隐私数据。
方法干净得有点不寻常。在端侧,MemPrivacy 先识别敏感片段,把它换成「语义结构化、保留类型信息的占位符」,再传到云端。云端模型对着这些结构化的替身做推理。本地再把原始值还原回去。隐私保护跟语义破坏解耦了。
数字。在隐私抽取上打过 GPT-5.2 跟 Gemini-3.1-Pro。推理延迟是下降而不是上升。各类 memory 系统的 utility 损失低于 1.6%。同时放出 MemPrivacy-Bench——52,000+ 隐私实例覆盖 200 个用户,配一套四级隐私分类,policy 可以直接挂上去。
结构上的解读:这正是所有人都在朝那个方向走的「个人 AI 云-边架构」里缺的那一块。PAI 跑在本地,Claude/GPT 在云端,目前唯一靠谱的桥就是「相信厂商不会拿你的东西去训练」。MemPrivacy 第一次认真提出——端侧在协议层面主动对云隐藏内容,同时云端还能继续推理。
如果 memory 已经在每个 agent 基础设施路线图上,privacy-preserving memory 刚刚成了第二根支柱。
https://arxiv.org/abs/2605.09530
← 返回所有文章
方法干净得有点不寻常。在端侧,MemPrivacy 先识别敏感片段,把它换成「语义结构化、保留类型信息的占位符」,再传到云端。云端模型对着这些结构化的替身做推理。本地再把原始值还原回去。隐私保护跟语义破坏解耦了。
数字。在隐私抽取上打过 GPT-5.2 跟 Gemini-3.1-Pro。推理延迟是下降而不是上升。各类 memory 系统的 utility 损失低于 1.6%。同时放出 MemPrivacy-Bench——52,000+ 隐私实例覆盖 200 个用户,配一套四级隐私分类,policy 可以直接挂上去。
结构上的解读:这正是所有人都在朝那个方向走的「个人 AI 云-边架构」里缺的那一块。PAI 跑在本地,Claude/GPT 在云端,目前唯一靠谱的桥就是「相信厂商不会拿你的东西去训练」。MemPrivacy 第一次认真提出——端侧在协议层面主动对云隐藏内容,同时云端还能继续推理。
如果 memory 已经在每个 agent 基础设施路线图上,privacy-preserving memory 刚刚成了第二根支柱。
https://arxiv.org/abs/2605.09530
评论