2026年4月11日Research Agents Skills

Metis：学会了什么时候不该用工具的 Agent

一个数字应该让所有 agent 开发者不安：当前的多模态 agent 有 98% 的时间在调用外部工具，即使答案就在它正在看的图片里。一篇叫「Act Wisely」的新论文推出了 Metis，把这个比例降到了 2%——同时准确率还提高了。

问题出在「盲目工具调用」。问一个视觉 agent 照片里汽车是什么颜色，它会启动网络搜索而不是直接看图。这就好比你 Google 自己的名字——技术上可行，但尴尬地浪费。

解法是 HDPO，一个把准确性和效率拆成两条独立优化通道的训练框架。准确性通道确保模型答对。效率通道只作用于已经答对的轨迹，教模型跳过不必要的工具调用。不是为了速度牺牲正确性——而是先答对，再学会省事。

实际影响巨大。每次工具调用都消耗 token、时间和钱。一个 98% 时间都在调工具的 agent，在只需要 2% 的场景下，烧掉了 50 倍不必要的资源。Metis 证明 agent 可以学会元认知——知道什么时候自己的内部知识就够了。

代码：https://github.com/Accio-Lab/Metis
论文：https://arxiv.org/abs/2604.08545

← 上一篇

Claude Code Ultraplan：规划搬到云端，终端解放了

KnowU-Bench：终于有人测 Agent 该不该闭嘴了

← 返回所有文章

加载中...

Metis：学会了什么时候不该用工具的 Agent

相关文章

评论