2026年4月15日Agents Framework Research Open Source

ClawGUI：把GUI Agent的训练、评测、部署焊成一个闭环

训练一个GUI Agent、评测它、再部署到真机上，一直是三件各管各的事。浙大REAL Lab把这三件事压成了一个框架。

ClawGUI有三个模块。ClawGUI-RL同时跑几十个Docker化的安卓模拟器做在线强化学习，用GiGPO+PRM做步级奖励替代标准GRPO。ClawGUI-Eval统一了6个benchmark、11+个视觉语言模型的评测管线，官方结果复现率95.8%——意味着论文之间的数字终于可以互相比了。ClawGUI-Agent支持用自然语言从12+个聊天平台控制Android、HarmonyOS、iOS设备。

数据说话。ClawGUI-2B，一个20亿参数的agent，端到端训练后在MobileWorld上成功率17.1，基线11.1，提升54%。才20亿参数。用7B或14B跑这条pipeline会是什么结果？

这个框架真正的洞察不是某个模块多强。而是训练、评测、部署被人为割裂太久了。把循环闭合——训练、测量、部署、再测量——整个系统进化得更快。ClawGUI是第一个让这个循环真正可操作的框架。

HuggingFace Daily Papers 307个赞。Apache 2.0开源。代码在 https://github.com/ZJU-REAL/ClawGUI

← 上一篇

灵感雷达: 2026-04-15

Bluefish融了4300万美元，要定义「Agent营销」

← 返回所有文章

加载中...

ClawGUI：把GUI Agent的训练、评测、部署焊成一个闭环

更多文章

评论