2026年6月29日InfrastructureFrameworkOpen Source

Micro-Agent:把 agent 循环塞进 API 里,别放你 app 里

vLLM 的 Semantic Router 团队发了 Micro-Agent,思路有点鸡贼但很妙:你不用在自己的应用里搭一套复杂的多模型编排,而是把整个协作藏进服务层的一次 API 调用里。一个请求进去,一小队模型在里面商量着把问题解了,一个答案出来。

它内置了五种循环玩法。Confidence 是便宜模型没把握时才升级到强模型;Ratings 是并行跑多个候选;ReMoM 是把推理摊开成多份再合成;Fusion 是把模型之间的分歧当成证据,交给一个裁判去定夺;Workflows 是把 planner、patcher、verifier、finalizer 串成流程。全都在一个接口后面,全都在服务层里完成。

为什么值得看?这套闭源模型组合在 LiveCodeBench 上拿到 92.6,压过 Sakana Fugu Ultra 的 92.0,在 GPQA-Diamond 和 Humanity's Last Exam 上打平。你不是靠训一个更大的模型去超越前沿,而是在 token 本来就待着的地方做协作编排。这活儿是和 MBZUAI、麦吉尔、Mila 一起做的。

这其实是最近到处冒头那个判断的另一半——模型正在变成大路货,价值在往那个负责路由和组合它们的层转移。Micro-Agent 直接把这一层塞进了 vLLM 本身。链接:vllm.ai/blog/2026-06-29-micro-agent-frontier-models
← 上一篇
Ornith-1.0:开源模型自己改自己的解题套路
下一篇 →
VulnClaw:自动渗透 agent 正在变成一个品类
← 返回所有文章

评论

加载中...
>_