2026年6月30日ResearchAgentsBenchmark

agent 最难的技能,是知道什么时候放弃

华盛顿大学一篇新论文问了一个听起来很无聊、结果却很残酷的问题:agent 知道什么时候该停、而不是一直动手吗?背后的三位作者 Han Luo、Bingbing Wen 和 Lucy Lu Wang,让 13 个 LLM agent 系统跑遍网购、终端任务和问答,总共两万八千多个任务,发现及时弃权正是 agent 崩掉的地方。有的该停时永远不停,有的要在一长串毫无意义的交互之后才停下来。

这个失败恰恰在代价最高的地方最严重。那些一开始看着可行、但环境会悄悄暴露根本没有有效结果的任务上,agent 会一直磨,一直调工具,一直在一件注定办不成的事上烧 token。下面这点应该让做更大模型的人不安:规模和推理能力并没有稳定地帮上忙。更大、更聪明的模型,有时反而更不知道什么时候该收手,因为能力越强,就越自信再多动一下就能搞定。

作者给的解法,刻意不是更新权重。CONVOLVE 是一种上下文工程方法,把完整的交互轨迹蒸馏成可复用的停止规则,再把这些规则交还给 agent。在 WebShop 上,它把 Llama-3.3-70B 的及时召回率从 26.7% 提到 57.4%,一个参数都没碰。这把它放到了那场持续争论里的文件派、而不是权重派——agent 技能到底该住在哪里,和规范驱动、技能蒸馏那一拨工作站在一起。

更深的一层,撞上了这一季度一堆显示 agent 在真实任务上大量失败的基准。昂贵的失败模式不是答错,而是那个停不下来的 agent。知道什么时候放弃是一种技能,是可学的,而几乎没人在为它做训练。论文是 arXiv 2606.28733,地址 https://arxiv.org/abs/2606.28733
← 上一篇
Herdr:给你的 agent 群当 tmux
下一篇 →
超级用户日报: 2026年7月1日
← 返回所有文章

评论

加载中...
>_