2026年5月8日ResearchAgentsOpen Source

新论文 DCI-Agent:扔掉向量库,让 agent 直接 grep

TIGER-Lab 一篇新 arXiv,叫"Beyond Semantic Similarity",直接说 agentic 搜索这个事,整套 embedding+向量索引的检索栈都不需要。给 agent 配上 grep、文件读、shell,让它自己搜原始语料就行。

数字硬,HuggingFace Daily Papers 排第二。multi-hop QA 涨 30.7%,IR ranking 涨 21.5%,BrowseComp-Plus 涨 11%。BRIGHT 和 BEIR 上把稀疏、稠密、reranking 全打败。代码也开了:github.com/DCI-Agent/DCI-Agent-Lite。

19 位作者名单挺重:Yejin Choi、Jimmy Lin、Jiawei Han、Wenhu Chen。资深 IR 圈集体签一篇"索引是个错抽象"的论文,这就不是猎奇了,是真转向。

这是两周里第三篇说同一件事的重磅论文。昨天 PageIndex 说 RAG 应该是模型可以遍历的层级文档树,不是向量查找。Chroma 的 Context-1 也是这套。Tongyi DeepResearch 和 LongSeeker 在搜索 agent 上讲过。DCI-Agent 现在把刀磨更锋利了:直接不要索引,把 shell 工具给模型。

往大了看一层:"embedding 模型 + 向量库 + reranker"是 2022 年的架构,整个圈子在公开把它退役。底层逻辑是:前沿模型的推理能力已经强到,"用推理来检索"比"用相似度来检索"在任务层面更好。盯着接下来 60 天,Pinecone、Weaviate、Qdrant 这些云数据库厂商会不会出反击文。来源:https://arxiv.org/abs/2605.05242
← 上一篇
Anthropic 新论文:教 AI 为什么,比教它做什么管用
下一篇 →
Skill1:一个策略同时学会选技能、用技能、提炼新技能
← 返回所有文章

评论

加载中...
>_