一篇新论文说别再重训模型了,去修 harness
今年的 AI 研究里有条暗线在慢慢成形:模型自己已经基本改进到头了,增量现在来自它外面那层 harness。一篇叫 Adaptive Auto-Harness 的新论文把这个想法推到了逻辑终点。它不要一个训练一停就冻住的静态 agent,而是提出一个在部署期间持续自我改进的系统,任务一条条进来,它就从这条开放式的真实任务流里学。
机制才是有意思的地方。Agent 在来什么任务就跑什么任务,盯着自己干得怎么样,然后调整自己的策略和脚手架,提示词、工具、路由,在任务分布漂移的时候维持住表现。不重训权重,不等下一个模型。学习的是 harness 本身。论文在 arXiv 上,编号 2606.01770。
把它和最近两周伯克利那篇 scale 系统而不是模型、还有蚂蚁的 SkillAdaptor 放一起读,这个模式就藏不住了。Agent 研究的重心已经从模型挪到了它外面的脚手架上。如果这条线成立,一个 agent 产品的护城河就不再是你用哪个底座模型,而是你的 harness 在用户真实工作上自我教学教得有多好。这是完全不同的一盘棋。
← 返回所有文章
机制才是有意思的地方。Agent 在来什么任务就跑什么任务,盯着自己干得怎么样,然后调整自己的策略和脚手架,提示词、工具、路由,在任务分布漂移的时候维持住表现。不重训权重,不等下一个模型。学习的是 harness 本身。论文在 arXiv 上,编号 2606.01770。
把它和最近两周伯克利那篇 scale 系统而不是模型、还有蚂蚁的 SkillAdaptor 放一起读,这个模式就藏不住了。Agent 研究的重心已经从模型挪到了它外面的脚手架上。如果这条线成立,一个 agent 产品的护城河就不再是你用哪个底座模型,而是你的 harness 在用户真实工作上自我教学教得有多好。这是完全不同的一盘棋。
评论