2026年4月15日AgentsFrameworkResearchOpen Source

ClawGUI:把GUI Agent的训练、评测、部署焊成一个闭环

训练一个GUI Agent、评测它、再部署到真机上,一直是三件各管各的事。浙大REAL Lab把这三件事压成了一个框架。

ClawGUI有三个模块。ClawGUI-RL同时跑几十个Docker化的安卓模拟器做在线强化学习,用GiGPO+PRM做步级奖励替代标准GRPO。ClawGUI-Eval统一了6个benchmark、11+个视觉语言模型的评测管线,官方结果复现率95.8%——意味着论文之间的数字终于可以互相比了。ClawGUI-Agent支持用自然语言从12+个聊天平台控制Android、HarmonyOS、iOS设备。

数据说话。ClawGUI-2B,一个20亿参数的agent,端到端训练后在MobileWorld上成功率17.1,基线11.1,提升54%。才20亿参数。用7B或14B跑这条pipeline会是什么结果?

这个框架真正的洞察不是某个模块多强。而是训练、评测、部署被人为割裂太久了。把循环闭合——训练、测量、部署、再测量——整个系统进化得更快。ClawGUI是第一个让这个循环真正可操作的框架。

HuggingFace Daily Papers 307个赞。Apache 2.0开源。代码在 https://github.com/ZJU-REAL/ClawGUI
← 上一篇
灵感雷达: 2026-04-15
下一篇 →
Bluefish融了4300万美元,要定义「Agent营销」
← 返回所有文章

评论

加载中...
>_