Web Speed 干掉「token 税」:用确定性 DOM-to-JSON 把 web agent 砍便宜 90%
Web Speed 今天上了 Product Hunt。一句话定位——干掉 token 税,agent 便宜 90%。实际产品是介于 agent 和网页之间的一个逻辑层,把原始 DOM 转成确定性的 JSON 机器地图。逻辑是这样的:让 LLM 去读 80KB 嵌套 HTML 就为了找一个按钮,是对 token 的愚蠢使用。预先把页面解析成结构化表示,只把 agent 需要的那部分喂过去,省 70% 到 90% 的账单。
交付形态是一个 MCP server 加多语言 SDK。接 Claude 或 Gemini,指向一个 URL,拿回一个 agent 可以直接推理的 JSON 地图。引擎是确定性的——同一个页面每次给同一份 JSON,没有随机重新解析,没有意外的 token 暴涨。Token 预算变成可规划量,不再是运行时风险。
这套定位有意思的地方——web agent 在便宜的页面上亏钱。传统讨论都聚焦在长上下文的贵任务上。Web Speed 指的是另一处漏点——每一次在重型页面上的 navigation 都在烧 token 换几乎为零的信息增量,agent 规模下这才是主要成本。把这块拆掉,消费级 web agent 的单位经济学就不再是倒挂的。
放在 PageIndex(5 月 8 日)旁边看——那个对文档做了类比的事,用基于推理的 retrieval 替代基于 embedding——以及过去两周更大的 vectorless-RAG 簇。共同模式——把 LLM 从解析路径上拽出来。能用确定性结构的地方就用,把模型 token 留给真的需要模型的那部分。agent 基础设施这一栈,越来越在做的事是把 token 路由到能产出回报的地方,不是塞更多 token 进去。
getwebspeed.io。今天 PH 发布。90% 这个数字值得在难啃的页面上验证——重 SPA 的应用、动态内容、付费墙——发布帖里创始人也承认了这些问题。值得接下来一个月盯一下生产案例。
← 返回所有文章
交付形态是一个 MCP server 加多语言 SDK。接 Claude 或 Gemini,指向一个 URL,拿回一个 agent 可以直接推理的 JSON 地图。引擎是确定性的——同一个页面每次给同一份 JSON,没有随机重新解析,没有意外的 token 暴涨。Token 预算变成可规划量,不再是运行时风险。
这套定位有意思的地方——web agent 在便宜的页面上亏钱。传统讨论都聚焦在长上下文的贵任务上。Web Speed 指的是另一处漏点——每一次在重型页面上的 navigation 都在烧 token 换几乎为零的信息增量,agent 规模下这才是主要成本。把这块拆掉,消费级 web agent 的单位经济学就不再是倒挂的。
放在 PageIndex(5 月 8 日)旁边看——那个对文档做了类比的事,用基于推理的 retrieval 替代基于 embedding——以及过去两周更大的 vectorless-RAG 簇。共同模式——把 LLM 从解析路径上拽出来。能用确定性结构的地方就用,把模型 token 留给真的需要模型的那部分。agent 基础设施这一栈,越来越在做的事是把 token 路由到能产出回报的地方,不是塞更多 token 进去。
getwebspeed.io。今天 PH 发布。90% 这个数字值得在难啃的页面上验证——重 SPA 的应用、动态内容、付费墙——发布帖里创始人也承认了这些问题。值得接下来一个月盯一下生产案例。
评论