Rosentic:抓agent之间互相搞砸的PR
Rosentic昨天Product Hunt第五,178赞。它解决的问题别人不爱讲。你让10个coding agent并行干活,每个PR单独跑CI都过,等几个一合并,仓库一半就烂了。单PR的CI工具看不见这种事。Rosentic做的是把每个开着的PR跟其他每个开着的PR交叉对比,把语义冲突挑出来。函数签名不一致、API契约对不上、能编译但运行时炸的那些。
反共识的地方是它没用什么。没有LLM。没有"AI审阅agent"。没有"AI驱动的冲突合并"。纯AST级别的结构匹配,确定性。同样扫描同样结果,永远一致。塞一个YAML配置,60秒装完,自己部署在自己infra,免费开源。其他家agent CI都在拼命往PR上塞LLM judge,Rosentic反过来出一个agent能信结果的快速确定性checker。
这个跟agent harness可靠性这条线直接接上。Cursor删数据库(4/23)、HERMES.md账单泄露(4/30)、Goblin事故复盘(4/30)、OpenClaw filter(5/1)、Mendral把harness外置(5/3),讲的都是闭源vendor harness在黑盒里干客户审计不到的事。Rosentic是同一个论点搬到合并这一层。10个agent抢着往你的repo推代码,你需要一个本身不依赖更多agent的检查。
它也是对agent CI市场走向的一个押注。LLM judge的方案,等团队每天几百个PR的时候,cost和一致性这两关都过不去。确定性工具规模化才赢。前几天的AgenticFlict那篇论文量化了并行agent PR的冲突率,比你想的高。Rosentic就是冲着那个数据点出来的。
官网 https://rosentic.com。
← 返回所有文章
反共识的地方是它没用什么。没有LLM。没有"AI审阅agent"。没有"AI驱动的冲突合并"。纯AST级别的结构匹配,确定性。同样扫描同样结果,永远一致。塞一个YAML配置,60秒装完,自己部署在自己infra,免费开源。其他家agent CI都在拼命往PR上塞LLM judge,Rosentic反过来出一个agent能信结果的快速确定性checker。
这个跟agent harness可靠性这条线直接接上。Cursor删数据库(4/23)、HERMES.md账单泄露(4/30)、Goblin事故复盘(4/30)、OpenClaw filter(5/1)、Mendral把harness外置(5/3),讲的都是闭源vendor harness在黑盒里干客户审计不到的事。Rosentic是同一个论点搬到合并这一层。10个agent抢着往你的repo推代码,你需要一个本身不依赖更多agent的检查。
它也是对agent CI市场走向的一个押注。LLM judge的方案,等团队每天几百个PR的时候,cost和一致性这两关都过不去。确定性工具规模化才赢。前几天的AgenticFlict那篇论文量化了并行agent PR的冲突率,比你想的高。Rosentic就是冲着那个数据点出来的。
官网 https://rosentic.com。
评论