Mendral:agent harness根本就不该在sandbox里
Mendral是个YC背书的AI DevOps团队,做CI agent。他们刚发了篇文章,说现在所有coding agent产品都把harness放错了位置。他们的论点:把harness放sandbox里,凭证就被迫进了sandbox,容器永远在跑(贵),团队间的共享memory也用不了。正确做法是harness放外面,用虚拟化文件系统把workspace路径路由到sandbox,memory路径路由到数据库。
这事重要,是因为过去两周agent harness可靠性一直在塌。4月23日Cursor删了一家公司的生产数据库。4月30日Claude Code的HERMES.md billing路由出bug漏钱。同一天Goblin postmortem放出来,显示66%的reward被偷。5月1日OpenClaw filter把配额刷空。十一天五起公开事故。架构共性就一个——harness逻辑只有厂商自己能审计。
Mendral的创始人Sam Alba和Andrea Luzzardi是Docker和Dagger出来的,做CI sandboxing已经十多年。这家公司已经在跑10000+ PRs每周的工程团队里跑——PostHog、Metabase、Inngest、Clipboard Health都是已签的客户。他们说能跨百万级job自动匹配73%的CI失败到已知问题。
技术论点很具体:sandbox变成cattle,思考阶段挂起,省算力钱。多人skill库放数据库不放分布式文件系统,干掉stale state。路径路由这个trick保留了模型训练时的API表面,但底下的backend可以换。如果这个架构赢了,所有闭源厂商的harness都会变成上面的薄壳。
原文:https://mendral.com/blog/agent-harness-belongs-outside-sandbox
← 返回所有文章
这事重要,是因为过去两周agent harness可靠性一直在塌。4月23日Cursor删了一家公司的生产数据库。4月30日Claude Code的HERMES.md billing路由出bug漏钱。同一天Goblin postmortem放出来,显示66%的reward被偷。5月1日OpenClaw filter把配额刷空。十一天五起公开事故。架构共性就一个——harness逻辑只有厂商自己能审计。
Mendral的创始人Sam Alba和Andrea Luzzardi是Docker和Dagger出来的,做CI sandboxing已经十多年。这家公司已经在跑10000+ PRs每周的工程团队里跑——PostHog、Metabase、Inngest、Clipboard Health都是已签的客户。他们说能跨百万级job自动匹配73%的CI失败到已知问题。
技术论点很具体:sandbox变成cattle,思考阶段挂起,省算力钱。多人skill库放数据库不放分布式文件系统,干掉stale state。路径路由这个trick保留了模型训练时的API表面,但底下的backend可以换。如果这个架构赢了,所有闭源厂商的harness都会变成上面的薄壳。
原文:https://mendral.com/blog/agent-harness-belongs-outside-sandbox
评论