2026年6月30日Research Agents Benchmark

agent 最难的技能，是知道什么时候放弃

华盛顿大学一篇新论文问了一个听起来很无聊、结果却很残酷的问题：agent 知道什么时候该停、而不是一直动手吗？背后的三位作者 Han Luo、Bingbing Wen 和 Lucy Lu Wang，让 13 个 LLM agent 系统跑遍网购、终端任务和问答，总共两万八千多个任务，发现及时弃权正是 agent 崩掉的地方。有的该停时永远不停，有的要在一长串毫无意义的交互之后才停下来。

这个失败恰恰在代价最高的地方最严重。那些一开始看着可行、但环境会悄悄暴露根本没有有效结果的任务上，agent 会一直磨，一直调工具，一直在一件注定办不成的事上烧 token。下面这点应该让做更大模型的人不安：规模和推理能力并没有稳定地帮上忙。更大、更聪明的模型，有时反而更不知道什么时候该收手，因为能力越强，就越自信再多动一下就能搞定。

作者给的解法，刻意不是更新权重。CONVOLVE 是一种上下文工程方法，把完整的交互轨迹蒸馏成可复用的停止规则，再把这些规则交还给 agent。在 WebShop 上，它把 Llama-3.3-70B 的及时召回率从 26.7% 提到 57.4%，一个参数都没碰。这把它放到了那场持续争论里的文件派、而不是权重派——agent 技能到底该住在哪里，和规范驱动、技能蒸馏那一拨工作站在一起。

更深的一层，撞上了这一季度一堆显示 agent 在真实任务上大量失败的基准。昂贵的失败模式不是答错，而是那个停不下来的 agent。知道什么时候放弃是一种技能，是可学的，而几乎没人在为它做训练。论文是 arXiv 2606.28733，地址 https://arxiv.org/abs/2606.28733

← 上一篇

Herdr：给你的 agent 群当 tmux

超级用户日报: 2026年7月1日

← 返回所有文章

加载中...

agent 最难的技能，是知道什么时候放弃

相关文章

评论