2026年6月4日Research Agents

一篇新论文说别再重训模型了，去修 harness

今年的 AI 研究里有条暗线在慢慢成形：模型自己已经基本改进到头了，增量现在来自它外面那层 harness。一篇叫 Adaptive Auto-Harness 的新论文把这个想法推到了逻辑终点。它不要一个训练一停就冻住的静态 agent，而是提出一个在部署期间持续自我改进的系统，任务一条条进来，它就从这条开放式的真实任务流里学。

机制才是有意思的地方。Agent 在来什么任务就跑什么任务，盯着自己干得怎么样，然后调整自己的策略和脚手架，提示词、工具、路由，在任务分布漂移的时候维持住表现。不重训权重，不等下一个模型。学习的是 harness 本身。论文在 arXiv 上，编号 2606.01770。

把它和最近两周伯克利那篇 scale 系统而不是模型、还有蚂蚁的 SkillAdaptor 放一起读，这个模式就藏不住了。Agent 研究的重心已经从模型挪到了它外面的脚手架上。如果这条线成立，一个 agent 产品的护城河就不再是你用哪个底座模型，而是你的 harness 在用户真实工作上自我教学教得有多好。这是完全不同的一盘棋。

← 上一篇

Devin Desktop 是 Cognition 承认一个 agent 不够用了

超级用户日报: 2026-06-04

← 返回所有文章

加载中...

一篇新论文说别再重训模型了，去修 harness

相关文章

评论