Kuri:一个464KB的Zig浏览器,按Token省钱而不是按像素渲染
Kuri今天上了HN,pitch朴素得让人舒服——Zig写的浏览器自动化工具,二进制464KB、冷启动3毫秒、不依赖Node.js,专门设计成让Agent的browser loop少烧Token。在Google Flights上的测试,Kuri一轮4110 Token,标准agent-browser 4880 Token,每一轮省16%。听起来没劲,直到你把它乘以一百万次Agent调用。
设计选择值得偷。大部分浏览器工具把页面状态当一坨冗长JSON丢给Agent,上下文窗口一半烧在Agent根本用不上的布局元数据上。Kuri改成accessibility tree snapshot加refs——Agent读一个紧凑稳定的表示、用命名引用而不是会失效的CSS selector来操作。一个二进制里有四个模式:CDP服务器、独立fetcher、终端浏览器、带Agent的CLI。你按任务挑最小的表面积。
这是Agent赛道里第二个认真做Zig原生浏览器的项目,另一个是Lightpanda,模式清楚了——Chrome为人设计、DOM为人设计、Playwright和Puppeteer为人设计。当浏览器的用户是按Token付费的LLM,赢的那个浏览器一定是第一天就按给LLM读设计的。Kuri是少数几家把这个信念贯彻到语言选择的。
实际问题是Token效率会不会成为Agent基础设施的采购决策因素。现在大部分builder选Playwright是因为它能用、不是因为它便宜。Kuri赌的是当生产Agent一天跑10万次browser cycle的时候,16%的Token节约会变成真金白银,有人最终会算这笔账。赌对的话,人形浏览器在Agent pipeline里的空间会缩得很快。
代码 https://github.com/justrach/kuri 。
← 返回所有文章
设计选择值得偷。大部分浏览器工具把页面状态当一坨冗长JSON丢给Agent,上下文窗口一半烧在Agent根本用不上的布局元数据上。Kuri改成accessibility tree snapshot加refs——Agent读一个紧凑稳定的表示、用命名引用而不是会失效的CSS selector来操作。一个二进制里有四个模式:CDP服务器、独立fetcher、终端浏览器、带Agent的CLI。你按任务挑最小的表面积。
这是Agent赛道里第二个认真做Zig原生浏览器的项目,另一个是Lightpanda,模式清楚了——Chrome为人设计、DOM为人设计、Playwright和Puppeteer为人设计。当浏览器的用户是按Token付费的LLM,赢的那个浏览器一定是第一天就按给LLM读设计的。Kuri是少数几家把这个信念贯彻到语言选择的。
实际问题是Token效率会不会成为Agent基础设施的采购决策因素。现在大部分builder选Playwright是因为它能用、不是因为它便宜。Kuri赌的是当生产Agent一天跑10万次browser cycle的时候,16%的Token节约会变成真金白银,有人最终会算这笔账。赌对的话,人形浏览器在Agent pipeline里的空间会缩得很快。
代码 https://github.com/justrach/kuri 。
评论