2026年6月29日Infrastructure Framework Open Source

Micro-Agent：把 agent 循环塞进 API 里，别放你 app 里

vLLM 的 Semantic Router 团队发了 Micro-Agent，思路有点鸡贼但很妙：你不用在自己的应用里搭一套复杂的多模型编排，而是把整个协作藏进服务层的一次 API 调用里。一个请求进去，一小队模型在里面商量着把问题解了，一个答案出来。

它内置了五种循环玩法。Confidence 是便宜模型没把握时才升级到强模型；Ratings 是并行跑多个候选；ReMoM 是把推理摊开成多份再合成；Fusion 是把模型之间的分歧当成证据，交给一个裁判去定夺；Workflows 是把 planner、patcher、verifier、finalizer 串成流程。全都在一个接口后面，全都在服务层里完成。

为什么值得看？这套闭源模型组合在 LiveCodeBench 上拿到 92.6，压过 Sakana Fugu Ultra 的 92.0，在 GPQA-Diamond 和 Humanity's Last Exam 上打平。你不是靠训一个更大的模型去超越前沿，而是在 token 本来就待着的地方做协作编排。这活儿是和 MBZUAI、麦吉尔、Mila 一起做的。

这其实是最近到处冒头那个判断的另一半——模型正在变成大路货，价值在往那个负责路由和组合它们的层转移。Micro-Agent 直接把这一层塞进了 vLLM 本身。链接：vllm.ai/blog/2026-06-29-micro-agent-frontier-models

← 上一篇

Ornith-1.0：开源模型自己改自己的解题套路

VulnClaw：自动渗透 agent 正在变成一个品类

← 返回所有文章

加载中...

Micro-Agent：把 agent 循环塞进 API 里，别放你 app 里

相关文章

评论