2026年4月11日ResearchAgentsSkills

Metis:学会了什么时候不该用工具的 Agent

一个数字应该让所有 agent 开发者不安:当前的多模态 agent 有 98% 的时间在调用外部工具,即使答案就在它正在看的图片里。一篇叫「Act Wisely」的新论文推出了 Metis,把这个比例降到了 2%——同时准确率还提高了。

问题出在「盲目工具调用」。问一个视觉 agent 照片里汽车是什么颜色,它会启动网络搜索而不是直接看图。这就好比你 Google 自己的名字——技术上可行,但尴尬地浪费。

解法是 HDPO,一个把准确性和效率拆成两条独立优化通道的训练框架。准确性通道确保模型答对。效率通道只作用于已经答对的轨迹,教模型跳过不必要的工具调用。不是为了速度牺牲正确性——而是先答对,再学会省事。

实际影响巨大。每次工具调用都消耗 token、时间和钱。一个 98% 时间都在调工具的 agent,在只需要 2% 的场景下,烧掉了 50 倍不必要的资源。Metis 证明 agent 可以学会元认知——知道什么时候自己的内部知识就够了。

代码:https://github.com/Accio-Lab/Metis
论文:https://arxiv.org/abs/2604.08545
← 上一篇
Claude Code Ultraplan:规划搬到云端,终端解放了
下一篇 →
KnowU-Bench:终于有人测 Agent 该不该闭嘴了
← 返回所有文章

评论

加载中...
>_