Mintlify ChromaFs:RAG已死,给Agent一个文件系统就够了
Mintlify刚发了一篇技术深度文章,应该重新定义我们对agent访问文档的思考方式。他们用一个叫ChromaFs的虚拟文件系统替换了整个RAG pipeline——效果很惊人。
RAG用于文档agent的问题是根本性的:RAG检索的是匹配查询的文本块,但如果答案跨越多个页面,或者需要的精确语法没有落在top-K结果里,agent就卡住了。Mintlify的洞察是,agent正在收敛到文件系统作为它们的主要接口。grep、cat、ls和find就是agent所需要的全部。如果每个文档页是一个文件,每个章节是一个目录,agent就能自主搜索精确字符串、读取完整页面、遍历整个结构。
ChromaFs把标准UNIX命令映射到对Mintlify的Chroma向量数据库的查询。Agent以为自己在浏览文件系统,但每个操作实际上是底层的语义查询。会话创建从p90的46秒降到约100毫秒。每次对话的边际计算成本归零,因为索引数据库可以复用。RBAC控制也是免费的——文件系统层在不需要沙盒的情况下执行用户级访问控制。
这不是玩具实验。ChromaFs为Mintlify的文档助手提供每天30000+次对话,服务数十万用户。这篇博文今天在Hacker News上获得了309分。
更大的启示是,文件系统抽象可能才是agent的正确通用接口——不是REST API,不是GraphQL,不是RAG。文件和目录是每个agent框架都已经理解的最大公约数。详情见mintlify.com/blog/how-we-built-a-virtual-filesystem-for-our-assistant。
← 返回所有文章
RAG用于文档agent的问题是根本性的:RAG检索的是匹配查询的文本块,但如果答案跨越多个页面,或者需要的精确语法没有落在top-K结果里,agent就卡住了。Mintlify的洞察是,agent正在收敛到文件系统作为它们的主要接口。grep、cat、ls和find就是agent所需要的全部。如果每个文档页是一个文件,每个章节是一个目录,agent就能自主搜索精确字符串、读取完整页面、遍历整个结构。
ChromaFs把标准UNIX命令映射到对Mintlify的Chroma向量数据库的查询。Agent以为自己在浏览文件系统,但每个操作实际上是底层的语义查询。会话创建从p90的46秒降到约100毫秒。每次对话的边际计算成本归零,因为索引数据库可以复用。RBAC控制也是免费的——文件系统层在不需要沙盒的情况下执行用户级访问控制。
这不是玩具实验。ChromaFs为Mintlify的文档助手提供每天30000+次对话,服务数十万用户。这篇博文今天在Hacker News上获得了309分。
更大的启示是,文件系统抽象可能才是agent的正确通用接口——不是REST API,不是GraphQL,不是RAG。文件和目录是每个agent框架都已经理解的最大公约数。详情见mintlify.com/blog/how-we-built-a-virtual-filesystem-for-our-assistant。
评论